iVOD / 165392

Field Value
IVOD_ID 165392
IVOD_URL https://ivod.ly.gov.tw/Play/Clip/1M/165392
日期 2025-11-13
會議資料.會議代碼 委員會-11-4-22-6
會議資料.會議代碼:str 第11屆第4會期教育及文化委員會第6次全體委員會議
會議資料.屆 11
會議資料.會期 4
會議資料.會次 6
會議資料.種類 委員會
會議資料.委員會代碼[0] 22
會議資料.委員會代碼:str[0] 教育及文化委員會
會議資料.標題 第11屆第4會期教育及文化委員會第6次全體委員會議
影片種類 Clip
開始時間 2025-11-13T11:28:56+08:00
結束時間 2025-11-13T11:38:47+08:00
影片長度 00:09:51
支援功能[0] ai-transcript
video_url https://ivod-lyvod.cdn.hinet.net/vod_1/_definst_/mp4:1MClips/fffa2c65c610facea4231039b7f4e29de72a0011d4bca9f90f406a00a8f97c069bfab19d618f9b825ea18f28b6918d91.mp4/playlist.m3u8
委員名稱 林宜瑾
委員發言時間 11:28:56 - 11:38:47
會議時間 2025-11-13T09:00:00+08:00
會議名稱 立法院第11屆第4會期教育及文化委員會第6次全體委員會議(事由:邀請中央研究院院長廖俊智列席報告業務概況,並備質詢。 【11月12日及13日兩天一次會】)
transcript.pyannote[0].speaker SPEAKER_00
transcript.pyannote[0].start 2.62971875
transcript.pyannote[0].end 4.48596875
transcript.pyannote[1].speaker SPEAKER_00
transcript.pyannote[1].start 5.81909375
transcript.pyannote[1].end 6.62909375
transcript.pyannote[2].speaker SPEAKER_01
transcript.pyannote[2].start 9.39659375
transcript.pyannote[2].end 10.35846875
transcript.pyannote[3].speaker SPEAKER_00
transcript.pyannote[3].start 11.01659375
transcript.pyannote[3].end 11.84346875
transcript.pyannote[4].speaker SPEAKER_00
transcript.pyannote[4].start 12.13034375
transcript.pyannote[4].end 16.99034375
transcript.pyannote[5].speaker SPEAKER_00
transcript.pyannote[5].start 17.71596875
transcript.pyannote[5].end 108.53721875
transcript.pyannote[6].speaker SPEAKER_00
transcript.pyannote[6].start 108.97596875
transcript.pyannote[6].end 110.71409375
transcript.pyannote[7].speaker SPEAKER_01
transcript.pyannote[7].start 111.54096875
transcript.pyannote[7].end 115.60784375
transcript.pyannote[8].speaker SPEAKER_01
transcript.pyannote[8].start 115.75971875
transcript.pyannote[8].end 121.00784375
transcript.pyannote[9].speaker SPEAKER_01
transcript.pyannote[9].start 121.44659375
transcript.pyannote[9].end 124.68659375
transcript.pyannote[10].speaker SPEAKER_01
transcript.pyannote[10].start 124.73721875
transcript.pyannote[10].end 132.12846875
transcript.pyannote[11].speaker SPEAKER_00
transcript.pyannote[11].start 127.06596875
transcript.pyannote[11].end 127.09971875
transcript.pyannote[12].speaker SPEAKER_00
transcript.pyannote[12].start 132.49971875
transcript.pyannote[12].end 132.92159375
transcript.pyannote[13].speaker SPEAKER_01
transcript.pyannote[13].start 132.92159375
transcript.pyannote[13].end 132.97221875
transcript.pyannote[14].speaker SPEAKER_00
transcript.pyannote[14].start 132.97221875
transcript.pyannote[14].end 133.02284375
transcript.pyannote[15].speaker SPEAKER_00
transcript.pyannote[15].start 133.25909375
transcript.pyannote[15].end 135.57096875
transcript.pyannote[16].speaker SPEAKER_00
transcript.pyannote[16].start 138.67596875
transcript.pyannote[16].end 227.92784375
transcript.pyannote[17].speaker SPEAKER_01
transcript.pyannote[17].start 225.17721875
transcript.pyannote[17].end 225.44721875
transcript.pyannote[18].speaker SPEAKER_01
transcript.pyannote[18].start 226.35846875
transcript.pyannote[18].end 230.00346875
transcript.pyannote[19].speaker SPEAKER_03
transcript.pyannote[19].start 230.40846875
transcript.pyannote[19].end 271.07721875
transcript.pyannote[20].speaker SPEAKER_01
transcript.pyannote[20].start 232.66971875
transcript.pyannote[20].end 233.09159375
transcript.pyannote[21].speaker SPEAKER_02
transcript.pyannote[21].start 267.88784375
transcript.pyannote[21].end 268.51221875
transcript.pyannote[22].speaker SPEAKER_03
transcript.pyannote[22].start 271.33034375
transcript.pyannote[22].end 298.63409375
transcript.pyannote[23].speaker SPEAKER_00
transcript.pyannote[23].start 275.88659375
transcript.pyannote[23].end 276.39284375
transcript.pyannote[24].speaker SPEAKER_00
transcript.pyannote[24].start 282.95721875
transcript.pyannote[24].end 283.37909375
transcript.pyannote[25].speaker SPEAKER_00
transcript.pyannote[25].start 298.80284375
transcript.pyannote[25].end 355.65471875
transcript.pyannote[26].speaker SPEAKER_01
transcript.pyannote[26].start 320.68971875
transcript.pyannote[26].end 320.79096875
transcript.pyannote[27].speaker SPEAKER_01
transcript.pyannote[27].start 320.87534375
transcript.pyannote[27].end 320.97659375
transcript.pyannote[28].speaker SPEAKER_04
transcript.pyannote[28].start 357.22409375
transcript.pyannote[28].end 430.29284375
transcript.pyannote[29].speaker SPEAKER_00
transcript.pyannote[29].start 357.84846875
transcript.pyannote[29].end 358.25346875
transcript.pyannote[30].speaker SPEAKER_00
transcript.pyannote[30].start 360.12659375
transcript.pyannote[30].end 361.08846875
transcript.pyannote[31].speaker SPEAKER_00
transcript.pyannote[31].start 369.07034375
transcript.pyannote[31].end 369.34034375
transcript.pyannote[32].speaker SPEAKER_00
transcript.pyannote[32].start 377.20409375
transcript.pyannote[32].end 377.59221875
transcript.pyannote[33].speaker SPEAKER_00
transcript.pyannote[33].start 380.49471875
transcript.pyannote[33].end 380.81534375
transcript.pyannote[34].speaker SPEAKER_00
transcript.pyannote[34].start 386.72159375
transcript.pyannote[34].end 386.89034375
transcript.pyannote[35].speaker SPEAKER_00
transcript.pyannote[35].start 388.89846875
transcript.pyannote[35].end 389.06721875
transcript.pyannote[36].speaker SPEAKER_00
transcript.pyannote[36].start 389.52284375
transcript.pyannote[36].end 390.73784375
transcript.pyannote[37].speaker SPEAKER_00
transcript.pyannote[37].start 393.25221875
transcript.pyannote[37].end 393.72471875
transcript.pyannote[38].speaker SPEAKER_00
transcript.pyannote[38].start 401.36909375
transcript.pyannote[38].end 401.94284375
transcript.pyannote[39].speaker SPEAKER_00
transcript.pyannote[39].start 412.01721875
transcript.pyannote[39].end 412.96221875
transcript.pyannote[40].speaker SPEAKER_00
transcript.pyannote[40].start 425.61846875
transcript.pyannote[40].end 425.83784375
transcript.pyannote[41].speaker SPEAKER_00
transcript.pyannote[41].start 430.57971875
transcript.pyannote[41].end 482.21721875
transcript.pyannote[42].speaker SPEAKER_00
transcript.pyannote[42].start 482.47034375
transcript.pyannote[42].end 510.63471875
transcript.pyannote[43].speaker SPEAKER_01
transcript.pyannote[43].start 511.91721875
transcript.pyannote[43].end 519.12284375
transcript.pyannote[44].speaker SPEAKER_02
transcript.pyannote[44].start 519.56159375
transcript.pyannote[44].end 539.77784375
transcript.pyannote[45].speaker SPEAKER_00
transcript.pyannote[45].start 536.99346875
transcript.pyannote[45].end 537.39846875
transcript.pyannote[46].speaker SPEAKER_02
transcript.pyannote[46].start 539.84534375
transcript.pyannote[46].end 581.88096875
transcript.pyannote[47].speaker SPEAKER_00
transcript.pyannote[47].start 563.94284375
transcript.pyannote[47].end 564.43221875
transcript.pyannote[48].speaker SPEAKER_00
transcript.pyannote[48].start 582.08346875
transcript.pyannote[48].end 585.44159375
transcript.pyannote[49].speaker SPEAKER_00
transcript.pyannote[49].start 586.89284375
transcript.pyannote[49].end 587.98971875
transcript.pyannote[50].speaker SPEAKER_00
transcript.pyannote[50].start 589.59284375
transcript.pyannote[50].end 590.72346875
transcript.whisperx[0].start 2.859
transcript.whisperx[0].end 9.885
transcript.whisperx[0].text 謝主席有請廖院長請廖院長林委員長
transcript.whisperx[1].start 11.198
transcript.whisperx[1].end 32.865
transcript.whisperx[1].text 院長早首先本席想要跟院長討論一下主權AI現在速發部正在推動台灣的主權AI各部會也要盤點適合的資料上架到台灣的AI訓練語言資料庫後續會開放民間跟政府機關來申請使用
transcript.whisperx[2].start 33.425
transcript.whisperx[2].end 54.857
transcript.whisperx[2].text 那速發部林部長說AI模型的訓練需要大量的資料那希望政府跟民間把擁有著作權的資料釋放出來以訓練出台灣觀點的AI模型那先前我有初步跟中研院詢問就是上架相關資料到台灣AI
transcript.whisperx[3].start 56.178
transcript.whisperx[3].end 79.874
transcript.whisperx[3].text 主權AI的訓練語言資料庫的情形那你們回覆的資料是說中研院目前已經有古漢語近代漢語跟敏克語當代華語的這個語料庫那除了這個古漢語的文獻資料已經沒有著作財產權那其他多數的文獻都需要一一去確認著作權跟智慧財產權
transcript.whisperx[4].start 81.355
transcript.whisperx[4].end 109.867
transcript.whisperx[4].text 而當代出版的包裝雜誌跟兒童讀物也要經過確認原始的著作權跟智慧財產權才可以考慮上架台灣的AI語言資料庫而口語的語料因為當初跟發音人簽授權的範圍只限於學術研究所以這個部分就沒有辦法開放上架AI語言資料庫院長我理解這樣對嗎
transcript.whisperx[5].start 112.145
transcript.whisperx[5].end 131.945
transcript.whisperx[5].text 大致正确但是我们目前是至少我个人是鼓励所有的研究人员在法规许可的范围内尽量开放这些语料供我们主权AI训练那我们有各种不同的方式那我们的专家一堆专家后面都请他们解释
transcript.whisperx[6].start 132.586
transcript.whisperx[6].end 153.386
transcript.whisperx[6].text 沒關係 院長 我先跟你再繼續探討下去喔因為我 就是說因為中研院擁有跟收錄這個全台灣最豐富的這個學術研究資源所以也是國內最高的研究單位所以我想歷年來建置很多很多的資料庫也很努力
transcript.whisperx[7].start 153.906
transcript.whisperx[7].end 172.325
transcript.whisperx[7].text 就像剛剛院長說很努力在致力於資料的開放那要開放供大眾研究的同時我覺得就是應該要將各項珍貴的資料來可以提供給台灣主權AI的資料庫所以如果能解決著作權
transcript.whisperx[8].start 173.166
transcript.whisperx[8].end 194.139
transcript.whisperx[8].text 跟智慧財產的問題那將這個豐富的資料文本可以上傳到台灣主權AI的語言資料庫我想勢必對這個這個主權AI的訓練一定有很大的幫忙所以請教院長中研院擁有這些文本的資料後續
transcript.whisperx[9].start 195.56
transcript.whisperx[9].end 216.851
transcript.whisperx[9].text 怎麼樣盡可能盡可能來上架到台灣主權AI的訓練語言資料庫特別是發音人的口語資料的問題有沒有辦法進一步來開放提供訓練台灣主權AI來使用因為要上傳所有的文本資料來提供台灣主權AI的使用
transcript.whisperx[10].start 217.811
transcript.whisperx[10].end 232.282
transcript.whisperx[10].text 是有沒有辦法跟原作的這個授權來脫鉤啦這個可能要來努力解決這個侵權的疑慮好委員好 我是制裁處處長邱文聰
transcript.whisperx[11].start 232.742
transcript.whisperx[11].end 251.194
transcript.whisperx[11].text 那針對委員的詢問如果說著作權是歸屬本院的部分的話我們願意沒有條件的來提供只要他目的是做訓練的話沒有問題但是委員提到如果他的來源的授權是受到限制也就是說權力不在本院不在眾院的話
transcript.whisperx[12].start 251.974
transcript.whisperx[12].end 276.753
transcript.whisperx[12].text 那要去突破可能就必须透过立法的方式或者是在个案上面法院去判定它是否构成合理使用那个人认为说这样子的途径其实是对于训练主权来讲确实是比较不足的但是要突破的话可能还是需要大院透过立法的方式比如说透过强制授权或者像是日本
transcript.whisperx[13].start 277.353
transcript.whisperx[13].end 299.123
transcript.whisperx[13].text 他们在助纣权法上面直接用立法的方式去明定为了这种训练的目的那这样的使用是属于合理使用才能够去解套不然的话我们自行在后端在未经权利人的同意下拿来做训练使用的话仍然是有可能会构成是一个违法的重置甚至违法的利用以上谢谢
transcript.whisperx[14].start 300.263
transcript.whisperx[14].end 327.181
transcript.whisperx[14].text 那另外先前中研院有提过就是说我们目前中研院自己的资料库虽然大部分有开放给民众使用可是还没有做到文字化的阶段那中研院之前是说人文组的运用人工智慧解锁历史文献这个计划已经审核通过了那我们正积极在推动最新的AI技术来加速这个资料的数位文字化
transcript.whisperx[15].start 331.463
transcript.whisperx[15].end 354.991
transcript.whisperx[15].text 訓練 所以想要請教院長的是這項計畫的工作進度如何那歷史文獻全文數位化的這個成果會上架到台灣主權AI的資料庫嗎那像是清嶺時代或者日治時代的一些文獻那應該早就沒有這個版權的問題那這些可以上架到台灣主權AI語言資料庫嗎
transcript.whisperx[16].start 357.507
transcript.whisperx[16].end 376.91
transcript.whisperx[16].text 這個部分 現在這位委員所秀 我是資訊所廖鴻元所長這個計畫就是我們連玲玲副所長她的計畫下面有四個我們綜藝院院長特別交代的專案計畫她有四個 目前有四個紙計畫在做
transcript.whisperx[17].start 377.29
transcript.whisperx[17].end 393.798
transcript.whisperx[17].text 那最主要像地籍古時候日治時代的那種地籍圖它需要經過因為它的字是用手寫的然後有很多蓋章所以我們需要經過影像處理一些處理然後再把它變成數位化那在這個狀況之下我們現在還在
transcript.whisperx[18].start 396.679
transcript.whisperx[18].end 415.391
transcript.whisperx[18].text 今年是第二年它的速度就增快非常多一开始的时候技术不足但是现在已经变得非常有技术所以这个部分在进行中然后我想这个部分呢至于它的那个因为它时代已经久远应该没有所谓的版权的问题是是是所以应该是可以纳入而且进行的相当好
transcript.whisperx[19].start 415.931
transcript.whisperx[19].end 430.135
transcript.whisperx[19].text 然后另外的还有台思索他们也有一个计划也是在做这是我们院长极力在推的这个怎么样把我们的这些文本资料有关于历史的文本资料能够把它数位化然后把它处理
transcript.whisperx[20].start 430.663
transcript.whisperx[20].end 453.186
transcript.whisperx[20].text 好謝謝那我再簡單再追問一個問題就是說中研院有個數位文化中心那大約有131個資料庫跟工具平台還有主題網站這些數位化的成果可是有些網站已經失效那需要轉置也需要這個重新檢視那資料那現在資料庫的數量有
transcript.whisperx[21].start 453.806
transcript.whisperx[21].end 481.806
transcript.whisperx[21].text 就現在需要重新檢視的資料庫有107個那看起來有做盤點下架那不過本席是發現還有少數的網站是失效的那另外本席之前也有說過就是說關鍵字的這個搜尋功能目前只能針對個別的網站來提供簡短的說明內容做搜尋那沒有辦法跨資料庫的檢索那這部分似乎好像還沒有改善
transcript.whisperx[22].start 482.566
transcript.whisperx[22].end 510.208
transcript.whisperx[22].text 整體來說就是說雖然中研院有數位典藏平台當作入口的網站可是匯整大部分的這個數位資源跟成果的網站跟實際操作起來還是難以實現跨資料庫的這個解鎖那使用者還是要就是要進到不同的網站然後反覆輸入關鍵字那以上本席所提到的中研院在改善經濟上覺得還有哪些的挑戰院長
transcript.whisperx[23].start 512.053
transcript.whisperx[23].end 539.606
transcript.whisperx[23].text 我想这方面网页失联部分我们会请数位文化中心可以改进好委员好上次委员提醒之后我们其实是在院长指示之下我们做各所的一个统整当然因为我们过去承接了过去国家数位典藏计划里面的一些资料所以包括了一些不只应该算100多个网站其实有300多个网站正在维运当中尤其有很多因为系统的部分也停摆了
transcript.whisperx[24].start 540.046
transcript.whisperx[24].end 557.206
transcript.whisperx[24].text 那这就是过去国家气候检查人员留下来的资产我们也希望能够火化现在我们注像是兵分两路一个是我们众议院既有的各个所他们所维运的系统是不是能透过您所提到的这种跨国户检索来进行那这东西涉及到整个网络架构的问题我们还在盘点之中
transcript.whisperx[25].start 557.867
transcript.whisperx[25].end 585.212
transcript.whisperx[25].text 另外一个就是国家数位典藏留下来这个300多个网页我们进行维聚当然也涉及到一个资安的问题那我们现在希望能够这东西提供一个联合目录的重新的整形和再并那这个情节上就会使得我们大家同仁在使用所谓过去国安建制的这些资料的时候能够继续使用和活化所以谢谢委员指导我们会进一步能够提供您的了解好 再努力再加油好 谢谢院长谢谢主席
transcript.whisperx[26].start 587.066
transcript.whisperx[26].end 590.495
transcript.whisperx[26].text 謝謝林益菁委員請院長回座