iVOD / 165392

Field	Value
IVOD_ID	165392
IVOD_URL	https://ivod.ly.gov.tw/Play/Clip/1M/165392
日期	2025-11-13
會議資料.會議代碼	委員會-11-4-22-6
會議資料.會議代碼:str	第11屆第4會期教育及文化委員會第6次全體委員會議
會議資料.屆	11
會議資料.會期	4
會議資料.會次	6
會議資料.種類	委員會
會議資料.委員會代碼[0]	22
會議資料.委員會代碼:str[0]	教育及文化委員會
會議資料.標題	第11屆第4會期教育及文化委員會第6次全體委員會議
影片種類	Clip
開始時間	2025-11-13T11:28:56+08:00
結束時間	2025-11-13T11:38:47+08:00
影片長度	00:09:51
支援功能[0]	ai-transcript
video_url	https://ivod-lyvod.cdn.hinet.net/vod_1/_definst_/mp4:1MClips/fffa2c65c610facea4231039b7f4e29de72a0011d4bca9f90f406a00a8f97c069bfab19d618f9b825ea18f28b6918d91.mp4/playlist.m3u8
委員名稱	林宜瑾
委員發言時間	11:28:56 - 11:38:47
會議時間	2025-11-13T09:00:00+08:00
會議名稱	立法院第11屆第4會期教育及文化委員會第6次全體委員會議（事由：邀請中央研究院院長廖俊智列席報告業務概況，並備質詢。【11月12日及13日兩天一次會】）
transcript.pyannote[0].speaker	SPEAKER_00
transcript.pyannote[0].start	2.62971875
transcript.pyannote[0].end	4.48596875
transcript.pyannote[1].speaker	SPEAKER_00
transcript.pyannote[1].start	5.81909375
transcript.pyannote[1].end	6.62909375
transcript.pyannote[2].speaker	SPEAKER_01
transcript.pyannote[2].start	9.39659375
transcript.pyannote[2].end	10.35846875
transcript.pyannote[3].speaker	SPEAKER_00
transcript.pyannote[3].start	11.01659375
transcript.pyannote[3].end	11.84346875
transcript.pyannote[4].speaker	SPEAKER_00
transcript.pyannote[4].start	12.13034375
transcript.pyannote[4].end	16.99034375
transcript.pyannote[5].speaker	SPEAKER_00
transcript.pyannote[5].start	17.71596875
transcript.pyannote[5].end	108.53721875
transcript.pyannote[6].speaker	SPEAKER_00
transcript.pyannote[6].start	108.97596875
transcript.pyannote[6].end	110.71409375
transcript.pyannote[7].speaker	SPEAKER_01
transcript.pyannote[7].start	111.54096875
transcript.pyannote[7].end	115.60784375
transcript.pyannote[8].speaker	SPEAKER_01
transcript.pyannote[8].start	115.75971875
transcript.pyannote[8].end	121.00784375
transcript.pyannote[9].speaker	SPEAKER_01
transcript.pyannote[9].start	121.44659375
transcript.pyannote[9].end	124.68659375
transcript.pyannote[10].speaker	SPEAKER_01
transcript.pyannote[10].start	124.73721875
transcript.pyannote[10].end	132.12846875
transcript.pyannote[11].speaker	SPEAKER_00
transcript.pyannote[11].start	127.06596875
transcript.pyannote[11].end	127.09971875
transcript.pyannote[12].speaker	SPEAKER_00
transcript.pyannote[12].start	132.49971875
transcript.pyannote[12].end	132.92159375
transcript.pyannote[13].speaker	SPEAKER_01
transcript.pyannote[13].start	132.92159375
transcript.pyannote[13].end	132.97221875
transcript.pyannote[14].speaker	SPEAKER_00
transcript.pyannote[14].start	132.97221875
transcript.pyannote[14].end	133.02284375
transcript.pyannote[15].speaker	SPEAKER_00
transcript.pyannote[15].start	133.25909375
transcript.pyannote[15].end	135.57096875
transcript.pyannote[16].speaker	SPEAKER_00
transcript.pyannote[16].start	138.67596875
transcript.pyannote[16].end	227.92784375
transcript.pyannote[17].speaker	SPEAKER_01
transcript.pyannote[17].start	225.17721875
transcript.pyannote[17].end	225.44721875
transcript.pyannote[18].speaker	SPEAKER_01
transcript.pyannote[18].start	226.35846875
transcript.pyannote[18].end	230.00346875
transcript.pyannote[19].speaker	SPEAKER_03
transcript.pyannote[19].start	230.40846875
transcript.pyannote[19].end	271.07721875
transcript.pyannote[20].speaker	SPEAKER_01
transcript.pyannote[20].start	232.66971875
transcript.pyannote[20].end	233.09159375
transcript.pyannote[21].speaker	SPEAKER_02
transcript.pyannote[21].start	267.88784375
transcript.pyannote[21].end	268.51221875
transcript.pyannote[22].speaker	SPEAKER_03
transcript.pyannote[22].start	271.33034375
transcript.pyannote[22].end	298.63409375
transcript.pyannote[23].speaker	SPEAKER_00
transcript.pyannote[23].start	275.88659375
transcript.pyannote[23].end	276.39284375
transcript.pyannote[24].speaker	SPEAKER_00
transcript.pyannote[24].start	282.95721875
transcript.pyannote[24].end	283.37909375
transcript.pyannote[25].speaker	SPEAKER_00
transcript.pyannote[25].start	298.80284375
transcript.pyannote[25].end	355.65471875
transcript.pyannote[26].speaker	SPEAKER_01
transcript.pyannote[26].start	320.68971875
transcript.pyannote[26].end	320.79096875
transcript.pyannote[27].speaker	SPEAKER_01
transcript.pyannote[27].start	320.87534375
transcript.pyannote[27].end	320.97659375
transcript.pyannote[28].speaker	SPEAKER_04
transcript.pyannote[28].start	357.22409375
transcript.pyannote[28].end	430.29284375
transcript.pyannote[29].speaker	SPEAKER_00
transcript.pyannote[29].start	357.84846875
transcript.pyannote[29].end	358.25346875
transcript.pyannote[30].speaker	SPEAKER_00
transcript.pyannote[30].start	360.12659375
transcript.pyannote[30].end	361.08846875
transcript.pyannote[31].speaker	SPEAKER_00
transcript.pyannote[31].start	369.07034375
transcript.pyannote[31].end	369.34034375
transcript.pyannote[32].speaker	SPEAKER_00
transcript.pyannote[32].start	377.20409375
transcript.pyannote[32].end	377.59221875
transcript.pyannote[33].speaker	SPEAKER_00
transcript.pyannote[33].start	380.49471875
transcript.pyannote[33].end	380.81534375
transcript.pyannote[34].speaker	SPEAKER_00
transcript.pyannote[34].start	386.72159375
transcript.pyannote[34].end	386.89034375
transcript.pyannote[35].speaker	SPEAKER_00
transcript.pyannote[35].start	388.89846875
transcript.pyannote[35].end	389.06721875
transcript.pyannote[36].speaker	SPEAKER_00
transcript.pyannote[36].start	389.52284375
transcript.pyannote[36].end	390.73784375
transcript.pyannote[37].speaker	SPEAKER_00
transcript.pyannote[37].start	393.25221875
transcript.pyannote[37].end	393.72471875
transcript.pyannote[38].speaker	SPEAKER_00
transcript.pyannote[38].start	401.36909375
transcript.pyannote[38].end	401.94284375
transcript.pyannote[39].speaker	SPEAKER_00
transcript.pyannote[39].start	412.01721875
transcript.pyannote[39].end	412.96221875
transcript.pyannote[40].speaker	SPEAKER_00
transcript.pyannote[40].start	425.61846875
transcript.pyannote[40].end	425.83784375
transcript.pyannote[41].speaker	SPEAKER_00
transcript.pyannote[41].start	430.57971875
transcript.pyannote[41].end	482.21721875
transcript.pyannote[42].speaker	SPEAKER_00
transcript.pyannote[42].start	482.47034375
transcript.pyannote[42].end	510.63471875
transcript.pyannote[43].speaker	SPEAKER_01
transcript.pyannote[43].start	511.91721875
transcript.pyannote[43].end	519.12284375
transcript.pyannote[44].speaker	SPEAKER_02
transcript.pyannote[44].start	519.56159375
transcript.pyannote[44].end	539.77784375
transcript.pyannote[45].speaker	SPEAKER_00
transcript.pyannote[45].start	536.99346875
transcript.pyannote[45].end	537.39846875
transcript.pyannote[46].speaker	SPEAKER_02
transcript.pyannote[46].start	539.84534375
transcript.pyannote[46].end	581.88096875
transcript.pyannote[47].speaker	SPEAKER_00
transcript.pyannote[47].start	563.94284375
transcript.pyannote[47].end	564.43221875
transcript.pyannote[48].speaker	SPEAKER_00
transcript.pyannote[48].start	582.08346875
transcript.pyannote[48].end	585.44159375
transcript.pyannote[49].speaker	SPEAKER_00
transcript.pyannote[49].start	586.89284375
transcript.pyannote[49].end	587.98971875
transcript.pyannote[50].speaker	SPEAKER_00
transcript.pyannote[50].start	589.59284375
transcript.pyannote[50].end	590.72346875
transcript.whisperx[0].start	2.859
transcript.whisperx[0].end	9.885
transcript.whisperx[0].text	謝主席有請廖院長請廖院長林委員長
transcript.whisperx[1].start	11.198
transcript.whisperx[1].end	32.865
transcript.whisperx[1].text	院長早首先本席想要跟院長討論一下主權AI現在速發部正在推動台灣的主權AI各部會也要盤點適合的資料上架到台灣的AI訓練語言資料庫後續會開放民間跟政府機關來申請使用
transcript.whisperx[2].start	33.425
transcript.whisperx[2].end	54.857
transcript.whisperx[2].text	那速發部林部長說AI模型的訓練需要大量的資料那希望政府跟民間把擁有著作權的資料釋放出來以訓練出台灣觀點的AI模型那先前我有初步跟中研院詢問就是上架相關資料到台灣AI
transcript.whisperx[3].start	56.178
transcript.whisperx[3].end	79.874
transcript.whisperx[3].text	主權AI的訓練語言資料庫的情形那你們回覆的資料是說中研院目前已經有古漢語近代漢語跟敏克語當代華語的這個語料庫那除了這個古漢語的文獻資料已經沒有著作財產權那其他多數的文獻都需要一一去確認著作權跟智慧財產權
transcript.whisperx[4].start	81.355
transcript.whisperx[4].end	109.867
transcript.whisperx[4].text	而當代出版的包裝雜誌跟兒童讀物也要經過確認原始的著作權跟智慧財產權才可以考慮上架台灣的AI語言資料庫而口語的語料因為當初跟發音人簽授權的範圍只限於學術研究所以這個部分就沒有辦法開放上架AI語言資料庫院長我理解這樣對嗎
transcript.whisperx[5].start	112.145
transcript.whisperx[5].end	131.945
transcript.whisperx[5].text	大致正确但是我们目前是至少我个人是鼓励所有的研究人员在法规许可的范围内尽量开放这些语料供我们主权AI训练那我们有各种不同的方式那我们的专家一堆专家后面都请他们解释
transcript.whisperx[6].start	132.586
transcript.whisperx[6].end	153.386
transcript.whisperx[6].text	沒關係院長我先跟你再繼續探討下去喔因為我就是說因為中研院擁有跟收錄這個全台灣最豐富的這個學術研究資源所以也是國內最高的研究單位所以我想歷年來建置很多很多的資料庫也很努力
transcript.whisperx[7].start	153.906
transcript.whisperx[7].end	172.325
transcript.whisperx[7].text	就像剛剛院長說很努力在致力於資料的開放那要開放供大眾研究的同時我覺得就是應該要將各項珍貴的資料來可以提供給台灣主權AI的資料庫所以如果能解決著作權
transcript.whisperx[8].start	173.166
transcript.whisperx[8].end	194.139
transcript.whisperx[8].text	跟智慧財產的問題那將這個豐富的資料文本可以上傳到台灣主權AI的語言資料庫我想勢必對這個這個主權AI的訓練一定有很大的幫忙所以請教院長中研院擁有這些文本的資料後續
transcript.whisperx[9].start	195.56
transcript.whisperx[9].end	216.851
transcript.whisperx[9].text	怎麼樣盡可能盡可能來上架到台灣主權AI的訓練語言資料庫特別是發音人的口語資料的問題有沒有辦法進一步來開放提供訓練台灣主權AI來使用因為要上傳所有的文本資料來提供台灣主權AI的使用
transcript.whisperx[10].start	217.811
transcript.whisperx[10].end	232.282
transcript.whisperx[10].text	是有沒有辦法跟原作的這個授權來脫鉤啦這個可能要來努力解決這個侵權的疑慮好委員好我是制裁處處長邱文聰
transcript.whisperx[11].start	232.742
transcript.whisperx[11].end	251.194
transcript.whisperx[11].text	那針對委員的詢問如果說著作權是歸屬本院的部分的話我們願意沒有條件的來提供只要他目的是做訓練的話沒有問題但是委員提到如果他的來源的授權是受到限制也就是說權力不在本院不在眾院的話
transcript.whisperx[12].start	251.974
transcript.whisperx[12].end	276.753
transcript.whisperx[12].text	那要去突破可能就必须透过立法的方式或者是在个案上面法院去判定它是否构成合理使用那个人认为说这样子的途径其实是对于训练主权来讲确实是比较不足的但是要突破的话可能还是需要大院透过立法的方式比如说透过强制授权或者像是日本
transcript.whisperx[13].start	277.353
transcript.whisperx[13].end	299.123
transcript.whisperx[13].text	他们在助纣权法上面直接用立法的方式去明定为了这种训练的目的那这样的使用是属于合理使用才能够去解套不然的话我们自行在后端在未经权利人的同意下拿来做训练使用的话仍然是有可能会构成是一个违法的重置甚至违法的利用以上谢谢
transcript.whisperx[14].start	300.263
transcript.whisperx[14].end	327.181
transcript.whisperx[14].text	那另外先前中研院有提过就是说我们目前中研院自己的资料库虽然大部分有开放给民众使用可是还没有做到文字化的阶段那中研院之前是说人文组的运用人工智慧解锁历史文献这个计划已经审核通过了那我们正积极在推动最新的AI技术来加速这个资料的数位文字化
transcript.whisperx[15].start	331.463
transcript.whisperx[15].end	354.991
transcript.whisperx[15].text	訓練所以想要請教院長的是這項計畫的工作進度如何那歷史文獻全文數位化的這個成果會上架到台灣主權AI的資料庫嗎那像是清嶺時代或者日治時代的一些文獻那應該早就沒有這個版權的問題那這些可以上架到台灣主權AI語言資料庫嗎
transcript.whisperx[16].start	357.507
transcript.whisperx[16].end	376.91
transcript.whisperx[16].text	這個部分現在這位委員所秀我是資訊所廖鴻元所長這個計畫就是我們連玲玲副所長她的計畫下面有四個我們綜藝院院長特別交代的專案計畫她有四個目前有四個紙計畫在做
transcript.whisperx[17].start	377.29
transcript.whisperx[17].end	393.798
transcript.whisperx[17].text	那最主要像地籍古時候日治時代的那種地籍圖它需要經過因為它的字是用手寫的然後有很多蓋章所以我們需要經過影像處理一些處理然後再把它變成數位化那在這個狀況之下我們現在還在
transcript.whisperx[18].start	396.679
transcript.whisperx[18].end	415.391
transcript.whisperx[18].text	今年是第二年它的速度就增快非常多一开始的时候技术不足但是现在已经变得非常有技术所以这个部分在进行中然后我想这个部分呢至于它的那个因为它时代已经久远应该没有所谓的版权的问题是是是所以应该是可以纳入而且进行的相当好
transcript.whisperx[19].start	415.931
transcript.whisperx[19].end	430.135
transcript.whisperx[19].text	然后另外的还有台思索他们也有一个计划也是在做这是我们院长极力在推的这个怎么样把我们的这些文本资料有关于历史的文本资料能够把它数位化然后把它处理
transcript.whisperx[20].start	430.663
transcript.whisperx[20].end	453.186
transcript.whisperx[20].text	好謝謝那我再簡單再追問一個問題就是說中研院有個數位文化中心那大約有131個資料庫跟工具平台還有主題網站這些數位化的成果可是有些網站已經失效那需要轉置也需要這個重新檢視那資料那現在資料庫的數量有
transcript.whisperx[21].start	453.806
transcript.whisperx[21].end	481.806
transcript.whisperx[21].text	就現在需要重新檢視的資料庫有107個那看起來有做盤點下架那不過本席是發現還有少數的網站是失效的那另外本席之前也有說過就是說關鍵字的這個搜尋功能目前只能針對個別的網站來提供簡短的說明內容做搜尋那沒有辦法跨資料庫的檢索那這部分似乎好像還沒有改善
transcript.whisperx[22].start	482.566
transcript.whisperx[22].end	510.208
transcript.whisperx[22].text	整體來說就是說雖然中研院有數位典藏平台當作入口的網站可是匯整大部分的這個數位資源跟成果的網站跟實際操作起來還是難以實現跨資料庫的這個解鎖那使用者還是要就是要進到不同的網站然後反覆輸入關鍵字那以上本席所提到的中研院在改善經濟上覺得還有哪些的挑戰院長
transcript.whisperx[23].start	512.053
transcript.whisperx[23].end	539.606
transcript.whisperx[23].text	我想这方面网页失联部分我们会请数位文化中心可以改进好委员好上次委员提醒之后我们其实是在院长指示之下我们做各所的一个统整当然因为我们过去承接了过去国家数位典藏计划里面的一些资料所以包括了一些不只应该算100多个网站其实有300多个网站正在维运当中尤其有很多因为系统的部分也停摆了
transcript.whisperx[24].start	540.046
transcript.whisperx[24].end	557.206
transcript.whisperx[24].text	那这就是过去国家气候检查人员留下来的资产我们也希望能够火化现在我们注像是兵分两路一个是我们众议院既有的各个所他们所维运的系统是不是能透过您所提到的这种跨国户检索来进行那这东西涉及到整个网络架构的问题我们还在盘点之中
transcript.whisperx[25].start	557.867
transcript.whisperx[25].end	585.212
transcript.whisperx[25].text	另外一个就是国家数位典藏留下来这个300多个网页我们进行维聚当然也涉及到一个资安的问题那我们现在希望能够这东西提供一个联合目录的重新的整形和再并那这个情节上就会使得我们大家同仁在使用所谓过去国安建制的这些资料的时候能够继续使用和活化所以谢谢委员指导我们会进一步能够提供您的了解好再努力再加油好谢谢院长谢谢主席
transcript.whisperx[26].start	587.066
transcript.whisperx[26].end	590.495
transcript.whisperx[26].text	謝謝林益菁委員請院長回座