| IVOD_ID |
165392 |
| IVOD_URL |
https://ivod.ly.gov.tw/Play/Clip/1M/165392 |
| 日期 |
2025-11-13 |
| 會議資料.會議代碼 |
委員會-11-4-22-6 |
| 會議資料.會議代碼:str |
第11屆第4會期教育及文化委員會第6次全體委員會議 |
| 會議資料.屆 |
11 |
| 會議資料.會期 |
4 |
| 會議資料.會次 |
6 |
| 會議資料.種類 |
委員會 |
| 會議資料.委員會代碼[0] |
22 |
| 會議資料.委員會代碼:str[0] |
教育及文化委員會 |
| 會議資料.標題 |
第11屆第4會期教育及文化委員會第6次全體委員會議 |
| 影片種類 |
Clip |
| 開始時間 |
2025-11-13T11:28:56+08:00 |
| 結束時間 |
2025-11-13T11:38:47+08:00 |
| 影片長度 |
00:09:51 |
| 支援功能[0] |
ai-transcript |
| video_url |
https://ivod-lyvod.cdn.hinet.net/vod_1/_definst_/mp4:1MClips/fffa2c65c610facea4231039b7f4e29de72a0011d4bca9f90f406a00a8f97c069bfab19d618f9b825ea18f28b6918d91.mp4/playlist.m3u8 |
| 委員名稱 |
林宜瑾 |
| 委員發言時間 |
11:28:56 - 11:38:47 |
| 會議時間 |
2025-11-13T09:00:00+08:00 |
| 會議名稱 |
立法院第11屆第4會期教育及文化委員會第6次全體委員會議(事由:邀請中央研究院院長廖俊智列席報告業務概況,並備質詢。
【11月12日及13日兩天一次會】) |
| transcript.pyannote[0].speaker |
SPEAKER_00 |
| transcript.pyannote[0].start |
2.62971875 |
| transcript.pyannote[0].end |
4.48596875 |
| transcript.pyannote[1].speaker |
SPEAKER_00 |
| transcript.pyannote[1].start |
5.81909375 |
| transcript.pyannote[1].end |
6.62909375 |
| transcript.pyannote[2].speaker |
SPEAKER_01 |
| transcript.pyannote[2].start |
9.39659375 |
| transcript.pyannote[2].end |
10.35846875 |
| transcript.pyannote[3].speaker |
SPEAKER_00 |
| transcript.pyannote[3].start |
11.01659375 |
| transcript.pyannote[3].end |
11.84346875 |
| transcript.pyannote[4].speaker |
SPEAKER_00 |
| transcript.pyannote[4].start |
12.13034375 |
| transcript.pyannote[4].end |
16.99034375 |
| transcript.pyannote[5].speaker |
SPEAKER_00 |
| transcript.pyannote[5].start |
17.71596875 |
| transcript.pyannote[5].end |
108.53721875 |
| transcript.pyannote[6].speaker |
SPEAKER_00 |
| transcript.pyannote[6].start |
108.97596875 |
| transcript.pyannote[6].end |
110.71409375 |
| transcript.pyannote[7].speaker |
SPEAKER_01 |
| transcript.pyannote[7].start |
111.54096875 |
| transcript.pyannote[7].end |
115.60784375 |
| transcript.pyannote[8].speaker |
SPEAKER_01 |
| transcript.pyannote[8].start |
115.75971875 |
| transcript.pyannote[8].end |
121.00784375 |
| transcript.pyannote[9].speaker |
SPEAKER_01 |
| transcript.pyannote[9].start |
121.44659375 |
| transcript.pyannote[9].end |
124.68659375 |
| transcript.pyannote[10].speaker |
SPEAKER_01 |
| transcript.pyannote[10].start |
124.73721875 |
| transcript.pyannote[10].end |
132.12846875 |
| transcript.pyannote[11].speaker |
SPEAKER_00 |
| transcript.pyannote[11].start |
127.06596875 |
| transcript.pyannote[11].end |
127.09971875 |
| transcript.pyannote[12].speaker |
SPEAKER_00 |
| transcript.pyannote[12].start |
132.49971875 |
| transcript.pyannote[12].end |
132.92159375 |
| transcript.pyannote[13].speaker |
SPEAKER_01 |
| transcript.pyannote[13].start |
132.92159375 |
| transcript.pyannote[13].end |
132.97221875 |
| transcript.pyannote[14].speaker |
SPEAKER_00 |
| transcript.pyannote[14].start |
132.97221875 |
| transcript.pyannote[14].end |
133.02284375 |
| transcript.pyannote[15].speaker |
SPEAKER_00 |
| transcript.pyannote[15].start |
133.25909375 |
| transcript.pyannote[15].end |
135.57096875 |
| transcript.pyannote[16].speaker |
SPEAKER_00 |
| transcript.pyannote[16].start |
138.67596875 |
| transcript.pyannote[16].end |
227.92784375 |
| transcript.pyannote[17].speaker |
SPEAKER_01 |
| transcript.pyannote[17].start |
225.17721875 |
| transcript.pyannote[17].end |
225.44721875 |
| transcript.pyannote[18].speaker |
SPEAKER_01 |
| transcript.pyannote[18].start |
226.35846875 |
| transcript.pyannote[18].end |
230.00346875 |
| transcript.pyannote[19].speaker |
SPEAKER_03 |
| transcript.pyannote[19].start |
230.40846875 |
| transcript.pyannote[19].end |
271.07721875 |
| transcript.pyannote[20].speaker |
SPEAKER_01 |
| transcript.pyannote[20].start |
232.66971875 |
| transcript.pyannote[20].end |
233.09159375 |
| transcript.pyannote[21].speaker |
SPEAKER_02 |
| transcript.pyannote[21].start |
267.88784375 |
| transcript.pyannote[21].end |
268.51221875 |
| transcript.pyannote[22].speaker |
SPEAKER_03 |
| transcript.pyannote[22].start |
271.33034375 |
| transcript.pyannote[22].end |
298.63409375 |
| transcript.pyannote[23].speaker |
SPEAKER_00 |
| transcript.pyannote[23].start |
275.88659375 |
| transcript.pyannote[23].end |
276.39284375 |
| transcript.pyannote[24].speaker |
SPEAKER_00 |
| transcript.pyannote[24].start |
282.95721875 |
| transcript.pyannote[24].end |
283.37909375 |
| transcript.pyannote[25].speaker |
SPEAKER_00 |
| transcript.pyannote[25].start |
298.80284375 |
| transcript.pyannote[25].end |
355.65471875 |
| transcript.pyannote[26].speaker |
SPEAKER_01 |
| transcript.pyannote[26].start |
320.68971875 |
| transcript.pyannote[26].end |
320.79096875 |
| transcript.pyannote[27].speaker |
SPEAKER_01 |
| transcript.pyannote[27].start |
320.87534375 |
| transcript.pyannote[27].end |
320.97659375 |
| transcript.pyannote[28].speaker |
SPEAKER_04 |
| transcript.pyannote[28].start |
357.22409375 |
| transcript.pyannote[28].end |
430.29284375 |
| transcript.pyannote[29].speaker |
SPEAKER_00 |
| transcript.pyannote[29].start |
357.84846875 |
| transcript.pyannote[29].end |
358.25346875 |
| transcript.pyannote[30].speaker |
SPEAKER_00 |
| transcript.pyannote[30].start |
360.12659375 |
| transcript.pyannote[30].end |
361.08846875 |
| transcript.pyannote[31].speaker |
SPEAKER_00 |
| transcript.pyannote[31].start |
369.07034375 |
| transcript.pyannote[31].end |
369.34034375 |
| transcript.pyannote[32].speaker |
SPEAKER_00 |
| transcript.pyannote[32].start |
377.20409375 |
| transcript.pyannote[32].end |
377.59221875 |
| transcript.pyannote[33].speaker |
SPEAKER_00 |
| transcript.pyannote[33].start |
380.49471875 |
| transcript.pyannote[33].end |
380.81534375 |
| transcript.pyannote[34].speaker |
SPEAKER_00 |
| transcript.pyannote[34].start |
386.72159375 |
| transcript.pyannote[34].end |
386.89034375 |
| transcript.pyannote[35].speaker |
SPEAKER_00 |
| transcript.pyannote[35].start |
388.89846875 |
| transcript.pyannote[35].end |
389.06721875 |
| transcript.pyannote[36].speaker |
SPEAKER_00 |
| transcript.pyannote[36].start |
389.52284375 |
| transcript.pyannote[36].end |
390.73784375 |
| transcript.pyannote[37].speaker |
SPEAKER_00 |
| transcript.pyannote[37].start |
393.25221875 |
| transcript.pyannote[37].end |
393.72471875 |
| transcript.pyannote[38].speaker |
SPEAKER_00 |
| transcript.pyannote[38].start |
401.36909375 |
| transcript.pyannote[38].end |
401.94284375 |
| transcript.pyannote[39].speaker |
SPEAKER_00 |
| transcript.pyannote[39].start |
412.01721875 |
| transcript.pyannote[39].end |
412.96221875 |
| transcript.pyannote[40].speaker |
SPEAKER_00 |
| transcript.pyannote[40].start |
425.61846875 |
| transcript.pyannote[40].end |
425.83784375 |
| transcript.pyannote[41].speaker |
SPEAKER_00 |
| transcript.pyannote[41].start |
430.57971875 |
| transcript.pyannote[41].end |
482.21721875 |
| transcript.pyannote[42].speaker |
SPEAKER_00 |
| transcript.pyannote[42].start |
482.47034375 |
| transcript.pyannote[42].end |
510.63471875 |
| transcript.pyannote[43].speaker |
SPEAKER_01 |
| transcript.pyannote[43].start |
511.91721875 |
| transcript.pyannote[43].end |
519.12284375 |
| transcript.pyannote[44].speaker |
SPEAKER_02 |
| transcript.pyannote[44].start |
519.56159375 |
| transcript.pyannote[44].end |
539.77784375 |
| transcript.pyannote[45].speaker |
SPEAKER_00 |
| transcript.pyannote[45].start |
536.99346875 |
| transcript.pyannote[45].end |
537.39846875 |
| transcript.pyannote[46].speaker |
SPEAKER_02 |
| transcript.pyannote[46].start |
539.84534375 |
| transcript.pyannote[46].end |
581.88096875 |
| transcript.pyannote[47].speaker |
SPEAKER_00 |
| transcript.pyannote[47].start |
563.94284375 |
| transcript.pyannote[47].end |
564.43221875 |
| transcript.pyannote[48].speaker |
SPEAKER_00 |
| transcript.pyannote[48].start |
582.08346875 |
| transcript.pyannote[48].end |
585.44159375 |
| transcript.pyannote[49].speaker |
SPEAKER_00 |
| transcript.pyannote[49].start |
586.89284375 |
| transcript.pyannote[49].end |
587.98971875 |
| transcript.pyannote[50].speaker |
SPEAKER_00 |
| transcript.pyannote[50].start |
589.59284375 |
| transcript.pyannote[50].end |
590.72346875 |
| transcript.whisperx[0].start |
2.859 |
| transcript.whisperx[0].end |
9.885 |
| transcript.whisperx[0].text |
謝主席有請廖院長請廖院長林委員長 |
| transcript.whisperx[1].start |
11.198 |
| transcript.whisperx[1].end |
32.865 |
| transcript.whisperx[1].text |
院長早首先本席想要跟院長討論一下主權AI現在速發部正在推動台灣的主權AI各部會也要盤點適合的資料上架到台灣的AI訓練語言資料庫後續會開放民間跟政府機關來申請使用 |
| transcript.whisperx[2].start |
33.425 |
| transcript.whisperx[2].end |
54.857 |
| transcript.whisperx[2].text |
那速發部林部長說AI模型的訓練需要大量的資料那希望政府跟民間把擁有著作權的資料釋放出來以訓練出台灣觀點的AI模型那先前我有初步跟中研院詢問就是上架相關資料到台灣AI |
| transcript.whisperx[3].start |
56.178 |
| transcript.whisperx[3].end |
79.874 |
| transcript.whisperx[3].text |
主權AI的訓練語言資料庫的情形那你們回覆的資料是說中研院目前已經有古漢語近代漢語跟敏克語當代華語的這個語料庫那除了這個古漢語的文獻資料已經沒有著作財產權那其他多數的文獻都需要一一去確認著作權跟智慧財產權 |
| transcript.whisperx[4].start |
81.355 |
| transcript.whisperx[4].end |
109.867 |
| transcript.whisperx[4].text |
而當代出版的包裝雜誌跟兒童讀物也要經過確認原始的著作權跟智慧財產權才可以考慮上架台灣的AI語言資料庫而口語的語料因為當初跟發音人簽授權的範圍只限於學術研究所以這個部分就沒有辦法開放上架AI語言資料庫院長我理解這樣對嗎 |
| transcript.whisperx[5].start |
112.145 |
| transcript.whisperx[5].end |
131.945 |
| transcript.whisperx[5].text |
大致正确但是我们目前是至少我个人是鼓励所有的研究人员在法规许可的范围内尽量开放这些语料供我们主权AI训练那我们有各种不同的方式那我们的专家一堆专家后面都请他们解释 |
| transcript.whisperx[6].start |
132.586 |
| transcript.whisperx[6].end |
153.386 |
| transcript.whisperx[6].text |
沒關係 院長 我先跟你再繼續探討下去喔因為我 就是說因為中研院擁有跟收錄這個全台灣最豐富的這個學術研究資源所以也是國內最高的研究單位所以我想歷年來建置很多很多的資料庫也很努力 |
| transcript.whisperx[7].start |
153.906 |
| transcript.whisperx[7].end |
172.325 |
| transcript.whisperx[7].text |
就像剛剛院長說很努力在致力於資料的開放那要開放供大眾研究的同時我覺得就是應該要將各項珍貴的資料來可以提供給台灣主權AI的資料庫所以如果能解決著作權 |
| transcript.whisperx[8].start |
173.166 |
| transcript.whisperx[8].end |
194.139 |
| transcript.whisperx[8].text |
跟智慧財產的問題那將這個豐富的資料文本可以上傳到台灣主權AI的語言資料庫我想勢必對這個這個主權AI的訓練一定有很大的幫忙所以請教院長中研院擁有這些文本的資料後續 |
| transcript.whisperx[9].start |
195.56 |
| transcript.whisperx[9].end |
216.851 |
| transcript.whisperx[9].text |
怎麼樣盡可能盡可能來上架到台灣主權AI的訓練語言資料庫特別是發音人的口語資料的問題有沒有辦法進一步來開放提供訓練台灣主權AI來使用因為要上傳所有的文本資料來提供台灣主權AI的使用 |
| transcript.whisperx[10].start |
217.811 |
| transcript.whisperx[10].end |
232.282 |
| transcript.whisperx[10].text |
是有沒有辦法跟原作的這個授權來脫鉤啦這個可能要來努力解決這個侵權的疑慮好委員好 我是制裁處處長邱文聰 |
| transcript.whisperx[11].start |
232.742 |
| transcript.whisperx[11].end |
251.194 |
| transcript.whisperx[11].text |
那針對委員的詢問如果說著作權是歸屬本院的部分的話我們願意沒有條件的來提供只要他目的是做訓練的話沒有問題但是委員提到如果他的來源的授權是受到限制也就是說權力不在本院不在眾院的話 |
| transcript.whisperx[12].start |
251.974 |
| transcript.whisperx[12].end |
276.753 |
| transcript.whisperx[12].text |
那要去突破可能就必须透过立法的方式或者是在个案上面法院去判定它是否构成合理使用那个人认为说这样子的途径其实是对于训练主权来讲确实是比较不足的但是要突破的话可能还是需要大院透过立法的方式比如说透过强制授权或者像是日本 |
| transcript.whisperx[13].start |
277.353 |
| transcript.whisperx[13].end |
299.123 |
| transcript.whisperx[13].text |
他们在助纣权法上面直接用立法的方式去明定为了这种训练的目的那这样的使用是属于合理使用才能够去解套不然的话我们自行在后端在未经权利人的同意下拿来做训练使用的话仍然是有可能会构成是一个违法的重置甚至违法的利用以上谢谢 |
| transcript.whisperx[14].start |
300.263 |
| transcript.whisperx[14].end |
327.181 |
| transcript.whisperx[14].text |
那另外先前中研院有提过就是说我们目前中研院自己的资料库虽然大部分有开放给民众使用可是还没有做到文字化的阶段那中研院之前是说人文组的运用人工智慧解锁历史文献这个计划已经审核通过了那我们正积极在推动最新的AI技术来加速这个资料的数位文字化 |
| transcript.whisperx[15].start |
331.463 |
| transcript.whisperx[15].end |
354.991 |
| transcript.whisperx[15].text |
訓練 所以想要請教院長的是這項計畫的工作進度如何那歷史文獻全文數位化的這個成果會上架到台灣主權AI的資料庫嗎那像是清嶺時代或者日治時代的一些文獻那應該早就沒有這個版權的問題那這些可以上架到台灣主權AI語言資料庫嗎 |
| transcript.whisperx[16].start |
357.507 |
| transcript.whisperx[16].end |
376.91 |
| transcript.whisperx[16].text |
這個部分 現在這位委員所秀 我是資訊所廖鴻元所長這個計畫就是我們連玲玲副所長她的計畫下面有四個我們綜藝院院長特別交代的專案計畫她有四個 目前有四個紙計畫在做 |
| transcript.whisperx[17].start |
377.29 |
| transcript.whisperx[17].end |
393.798 |
| transcript.whisperx[17].text |
那最主要像地籍古時候日治時代的那種地籍圖它需要經過因為它的字是用手寫的然後有很多蓋章所以我們需要經過影像處理一些處理然後再把它變成數位化那在這個狀況之下我們現在還在 |
| transcript.whisperx[18].start |
396.679 |
| transcript.whisperx[18].end |
415.391 |
| transcript.whisperx[18].text |
今年是第二年它的速度就增快非常多一开始的时候技术不足但是现在已经变得非常有技术所以这个部分在进行中然后我想这个部分呢至于它的那个因为它时代已经久远应该没有所谓的版权的问题是是是所以应该是可以纳入而且进行的相当好 |
| transcript.whisperx[19].start |
415.931 |
| transcript.whisperx[19].end |
430.135 |
| transcript.whisperx[19].text |
然后另外的还有台思索他们也有一个计划也是在做这是我们院长极力在推的这个怎么样把我们的这些文本资料有关于历史的文本资料能够把它数位化然后把它处理 |
| transcript.whisperx[20].start |
430.663 |
| transcript.whisperx[20].end |
453.186 |
| transcript.whisperx[20].text |
好謝謝那我再簡單再追問一個問題就是說中研院有個數位文化中心那大約有131個資料庫跟工具平台還有主題網站這些數位化的成果可是有些網站已經失效那需要轉置也需要這個重新檢視那資料那現在資料庫的數量有 |
| transcript.whisperx[21].start |
453.806 |
| transcript.whisperx[21].end |
481.806 |
| transcript.whisperx[21].text |
就現在需要重新檢視的資料庫有107個那看起來有做盤點下架那不過本席是發現還有少數的網站是失效的那另外本席之前也有說過就是說關鍵字的這個搜尋功能目前只能針對個別的網站來提供簡短的說明內容做搜尋那沒有辦法跨資料庫的檢索那這部分似乎好像還沒有改善 |
| transcript.whisperx[22].start |
482.566 |
| transcript.whisperx[22].end |
510.208 |
| transcript.whisperx[22].text |
整體來說就是說雖然中研院有數位典藏平台當作入口的網站可是匯整大部分的這個數位資源跟成果的網站跟實際操作起來還是難以實現跨資料庫的這個解鎖那使用者還是要就是要進到不同的網站然後反覆輸入關鍵字那以上本席所提到的中研院在改善經濟上覺得還有哪些的挑戰院長 |
| transcript.whisperx[23].start |
512.053 |
| transcript.whisperx[23].end |
539.606 |
| transcript.whisperx[23].text |
我想这方面网页失联部分我们会请数位文化中心可以改进好委员好上次委员提醒之后我们其实是在院长指示之下我们做各所的一个统整当然因为我们过去承接了过去国家数位典藏计划里面的一些资料所以包括了一些不只应该算100多个网站其实有300多个网站正在维运当中尤其有很多因为系统的部分也停摆了 |
| transcript.whisperx[24].start |
540.046 |
| transcript.whisperx[24].end |
557.206 |
| transcript.whisperx[24].text |
那这就是过去国家气候检查人员留下来的资产我们也希望能够火化现在我们注像是兵分两路一个是我们众议院既有的各个所他们所维运的系统是不是能透过您所提到的这种跨国户检索来进行那这东西涉及到整个网络架构的问题我们还在盘点之中 |
| transcript.whisperx[25].start |
557.867 |
| transcript.whisperx[25].end |
585.212 |
| transcript.whisperx[25].text |
另外一个就是国家数位典藏留下来这个300多个网页我们进行维聚当然也涉及到一个资安的问题那我们现在希望能够这东西提供一个联合目录的重新的整形和再并那这个情节上就会使得我们大家同仁在使用所谓过去国安建制的这些资料的时候能够继续使用和活化所以谢谢委员指导我们会进一步能够提供您的了解好 再努力再加油好 谢谢院长谢谢主席 |
| transcript.whisperx[26].start |
587.066 |
| transcript.whisperx[26].end |
590.495 |
| transcript.whisperx[26].text |
謝謝林益菁委員請院長回座 |