iVOD / 167570

Field Value
IVOD_ID 167570
IVOD_URL https://ivod.ly.gov.tw/Play/Clip/1M/167570
日期 2026-03-18
會議資料.會議代碼 委員會-11-5-23-2
會議資料.會議代碼:str 第11屆第5會期交通委員會第2次全體委員會議
會議資料.屆 11
會議資料.會期 5
會議資料.會次 2
會議資料.種類 委員會
會議資料.委員會代碼[0] 23
會議資料.委員會代碼:str[0] 交通委員會
會議資料.標題 第11屆第5會期交通委員會第2次全體委員會議
影片種類 Clip
開始時間 2026-03-18T09:39:11+08:00
結束時間 2026-03-18T09:49:38+08:00
影片長度 00:10:27
支援功能[0] ai-transcript
video_url https://ivod-lyvod.cdn.hinet.net/vod_1/_definst_/mp4:1MClips/4e26a61b53ad6053a0b16607070185ca75f3d6415d2a29ea854b2f19bd25f7008ce2492c85169a165ea18f28b6918d91.mp4/playlist.m3u8
委員名稱 李昆澤
委員發言時間 09:39:11 - 09:49:38
會議時間 2026-03-18T09:00:00+08:00
會議名稱 立法院第11屆第5會期交通委員會第2次全體委員會議(事由:邀請數位發展部部長及國家科學及技術委員會主任委員就「落實臺灣AI治理與基礎建設,發展臺灣AI軟體產業」進行專題報告,並備質詢。【3月18日及19日二天一次會】)
transcript.pyannote[0].speaker SPEAKER_02
transcript.pyannote[0].start 3.25409375
transcript.pyannote[0].end 5.76846875
transcript.pyannote[1].speaker SPEAKER_02
transcript.pyannote[1].start 6.29159375
transcript.pyannote[1].end 7.60784375
transcript.pyannote[2].speaker SPEAKER_02
transcript.pyannote[2].start 14.25659375
transcript.pyannote[2].end 14.83034375
transcript.pyannote[3].speaker SPEAKER_02
transcript.pyannote[3].start 15.60659375
transcript.pyannote[3].end 32.04284375
transcript.pyannote[4].speaker SPEAKER_02
transcript.pyannote[4].start 32.51534375
transcript.pyannote[4].end 34.33784375
transcript.pyannote[5].speaker SPEAKER_02
transcript.pyannote[5].start 34.89471875
transcript.pyannote[5].end 96.23534375
transcript.pyannote[6].speaker SPEAKER_00
transcript.pyannote[6].start 41.66159375
transcript.pyannote[6].end 42.11721875
transcript.pyannote[7].speaker SPEAKER_02
transcript.pyannote[7].start 96.72471875
transcript.pyannote[7].end 106.37721875
transcript.pyannote[8].speaker SPEAKER_00
transcript.pyannote[8].start 100.47096875
transcript.pyannote[8].end 101.14596875
transcript.pyannote[9].speaker SPEAKER_02
transcript.pyannote[9].start 106.52909375
transcript.pyannote[9].end 107.71034375
transcript.pyannote[10].speaker SPEAKER_02
transcript.pyannote[10].start 108.40221875
transcript.pyannote[10].end 120.18096875
transcript.pyannote[11].speaker SPEAKER_02
transcript.pyannote[11].start 121.91909375
transcript.pyannote[11].end 123.82596875
transcript.pyannote[12].speaker SPEAKER_02
transcript.pyannote[12].start 124.41659375
transcript.pyannote[12].end 142.91159375
transcript.pyannote[13].speaker SPEAKER_00
transcript.pyannote[13].start 134.20409375
transcript.pyannote[13].end 135.08159375
transcript.pyannote[14].speaker SPEAKER_00
transcript.pyannote[14].start 140.98784375
transcript.pyannote[14].end 141.30846875
transcript.pyannote[15].speaker SPEAKER_00
transcript.pyannote[15].start 142.91159375
transcript.pyannote[15].end 142.92846875
transcript.pyannote[16].speaker SPEAKER_02
transcript.pyannote[16].start 142.92846875
transcript.pyannote[16].end 142.94534375
transcript.pyannote[17].speaker SPEAKER_00
transcript.pyannote[17].start 142.94534375
transcript.pyannote[17].end 157.30596875
transcript.pyannote[18].speaker SPEAKER_00
transcript.pyannote[18].start 157.69409375
transcript.pyannote[18].end 172.03784375
transcript.pyannote[19].speaker SPEAKER_00
transcript.pyannote[19].start 172.71284375
transcript.pyannote[19].end 180.84659375
transcript.pyannote[20].speaker SPEAKER_00
transcript.pyannote[20].start 181.16721875
transcript.pyannote[20].end 197.28284375
transcript.pyannote[21].speaker SPEAKER_02
transcript.pyannote[21].start 197.28284375
transcript.pyannote[21].end 202.02471875
transcript.pyannote[22].speaker SPEAKER_00
transcript.pyannote[22].start 202.02471875
transcript.pyannote[22].end 213.07784375
transcript.pyannote[23].speaker SPEAKER_01
transcript.pyannote[23].start 212.58846875
transcript.pyannote[23].end 213.38159375
transcript.pyannote[24].speaker SPEAKER_01
transcript.pyannote[24].start 213.44909375
transcript.pyannote[24].end 217.16159375
transcript.pyannote[25].speaker SPEAKER_01
transcript.pyannote[25].start 217.71846875
transcript.pyannote[25].end 229.26096875
transcript.pyannote[26].speaker SPEAKER_02
transcript.pyannote[26].start 229.26096875
transcript.pyannote[26].end 229.42971875
transcript.pyannote[27].speaker SPEAKER_01
transcript.pyannote[27].start 229.42971875
transcript.pyannote[27].end 229.90221875
transcript.pyannote[28].speaker SPEAKER_02
transcript.pyannote[28].start 229.90221875
transcript.pyannote[28].end 249.19034375
transcript.pyannote[29].speaker SPEAKER_00
transcript.pyannote[29].start 240.09471875
transcript.pyannote[29].end 240.41534375
transcript.pyannote[30].speaker SPEAKER_02
transcript.pyannote[30].start 249.34221875
transcript.pyannote[30].end 261.42471875
transcript.pyannote[31].speaker SPEAKER_00
transcript.pyannote[31].start 249.47721875
transcript.pyannote[31].end 249.69659375
transcript.pyannote[32].speaker SPEAKER_00
transcript.pyannote[32].start 256.00784375
transcript.pyannote[32].end 256.34534375
transcript.pyannote[33].speaker SPEAKER_02
transcript.pyannote[33].start 261.89721875
transcript.pyannote[33].end 286.06221875
transcript.pyannote[34].speaker SPEAKER_00
transcript.pyannote[34].start 271.66784375
transcript.pyannote[34].end 272.05596875
transcript.pyannote[35].speaker SPEAKER_02
transcript.pyannote[35].start 286.48409375
transcript.pyannote[35].end 296.47409375
transcript.pyannote[36].speaker SPEAKER_00
transcript.pyannote[36].start 288.22221875
transcript.pyannote[36].end 288.93096875
transcript.pyannote[37].speaker SPEAKER_00
transcript.pyannote[37].start 296.69346875
transcript.pyannote[37].end 344.29784375
transcript.pyannote[38].speaker SPEAKER_02
transcript.pyannote[38].start 343.08284375
transcript.pyannote[38].end 386.95784375
transcript.pyannote[39].speaker SPEAKER_00
transcript.pyannote[39].start 383.02596875
transcript.pyannote[39].end 383.04284375
transcript.pyannote[40].speaker SPEAKER_00
transcript.pyannote[40].start 383.05971875
transcript.pyannote[40].end 383.12721875
transcript.pyannote[41].speaker SPEAKER_00
transcript.pyannote[41].start 383.16096875
transcript.pyannote[41].end 383.17784375
transcript.pyannote[42].speaker SPEAKER_00
transcript.pyannote[42].start 386.95784375
transcript.pyannote[42].end 424.74096875
transcript.pyannote[43].speaker SPEAKER_02
transcript.pyannote[43].start 423.57659375
transcript.pyannote[43].end 464.43096875
transcript.pyannote[44].speaker SPEAKER_00
transcript.pyannote[44].start 425.97284375
transcript.pyannote[44].end 426.27659375
transcript.pyannote[45].speaker SPEAKER_00
transcript.pyannote[45].start 433.66784375
transcript.pyannote[45].end 434.05596875
transcript.pyannote[46].speaker SPEAKER_00
transcript.pyannote[46].start 440.63721875
transcript.pyannote[46].end 440.82284375
transcript.pyannote[47].speaker SPEAKER_00
transcript.pyannote[47].start 451.69034375
transcript.pyannote[47].end 451.75784375
transcript.pyannote[48].speaker SPEAKER_00
transcript.pyannote[48].start 457.91721875
transcript.pyannote[48].end 458.62596875
transcript.pyannote[49].speaker SPEAKER_00
transcript.pyannote[49].start 462.16971875
transcript.pyannote[49].end 462.22034375
transcript.pyannote[50].speaker SPEAKER_00
transcript.pyannote[50].start 463.87409375
transcript.pyannote[50].end 463.89096875
transcript.pyannote[51].speaker SPEAKER_00
transcript.pyannote[51].start 463.95846875
transcript.pyannote[51].end 464.22846875
transcript.pyannote[52].speaker SPEAKER_02
transcript.pyannote[52].start 465.00471875
transcript.pyannote[52].end 473.10471875
transcript.pyannote[53].speaker SPEAKER_00
transcript.pyannote[53].start 473.10471875
transcript.pyannote[53].end 473.49284375
transcript.pyannote[54].speaker SPEAKER_02
transcript.pyannote[54].start 473.49284375
transcript.pyannote[54].end 473.61096875
transcript.pyannote[55].speaker SPEAKER_00
transcript.pyannote[55].start 473.61096875
transcript.pyannote[55].end 475.60221875
transcript.pyannote[56].speaker SPEAKER_02
transcript.pyannote[56].start 475.60221875
transcript.pyannote[56].end 485.89596875
transcript.pyannote[57].speaker SPEAKER_00
transcript.pyannote[57].start 475.61909375
transcript.pyannote[57].end 476.26034375
transcript.pyannote[58].speaker SPEAKER_02
transcript.pyannote[58].start 486.60471875
transcript.pyannote[58].end 494.90721875
transcript.pyannote[59].speaker SPEAKER_02
transcript.pyannote[59].start 495.05909375
transcript.pyannote[59].end 496.96596875
transcript.pyannote[60].speaker SPEAKER_02
transcript.pyannote[60].start 497.47221875
transcript.pyannote[60].end 502.24784375
transcript.pyannote[61].speaker SPEAKER_02
transcript.pyannote[61].start 502.39971875
transcript.pyannote[61].end 512.59221875
transcript.pyannote[62].speaker SPEAKER_00
transcript.pyannote[62].start 510.49971875
transcript.pyannote[62].end 510.82034375
transcript.pyannote[63].speaker SPEAKER_02
transcript.pyannote[63].start 512.79471875
transcript.pyannote[63].end 544.95846875
transcript.pyannote[64].speaker SPEAKER_00
transcript.pyannote[64].start 531.08721875
transcript.pyannote[64].end 532.36971875
transcript.pyannote[65].speaker SPEAKER_00
transcript.pyannote[65].start 532.45409375
transcript.pyannote[65].end 532.97721875
transcript.pyannote[66].speaker SPEAKER_00
transcript.pyannote[66].start 538.90034375
transcript.pyannote[66].end 539.30534375
transcript.pyannote[67].speaker SPEAKER_00
transcript.pyannote[67].start 544.62096875
transcript.pyannote[67].end 544.77284375
transcript.pyannote[68].speaker SPEAKER_02
transcript.pyannote[68].start 545.44784375
transcript.pyannote[68].end 550.25721875
transcript.pyannote[69].speaker SPEAKER_00
transcript.pyannote[69].start 550.25721875
transcript.pyannote[69].end 589.35659375
transcript.pyannote[70].speaker SPEAKER_00
transcript.pyannote[70].start 590.13284375
transcript.pyannote[70].end 600.07221875
transcript.pyannote[71].speaker SPEAKER_00
transcript.pyannote[71].start 600.69659375
transcript.pyannote[71].end 601.28721875
transcript.pyannote[72].speaker SPEAKER_02
transcript.pyannote[72].start 601.28721875
transcript.pyannote[72].end 601.43909375
transcript.pyannote[73].speaker SPEAKER_02
transcript.pyannote[73].start 601.59096875
transcript.pyannote[73].end 601.67534375
transcript.pyannote[74].speaker SPEAKER_00
transcript.pyannote[74].start 601.67534375
transcript.pyannote[74].end 601.96221875
transcript.pyannote[75].speaker SPEAKER_02
transcript.pyannote[75].start 601.96221875
transcript.pyannote[75].end 627.86534375
transcript.pyannote[76].speaker SPEAKER_00
transcript.pyannote[76].start 604.96596875
transcript.pyannote[76].end 605.30346875
transcript.pyannote[77].speaker SPEAKER_00
transcript.pyannote[77].start 610.92284375
transcript.pyannote[77].end 611.61471875
transcript.whisperx[0].start 3.656
transcript.whisperx[0].end 7.351
transcript.whisperx[0].text 謝謝林俊憲召委 請一下林部長我們邀請蘇澳部林部長
transcript.whisperx[1].start 14.318
transcript.whisperx[1].end 33.894
transcript.whisperx[1].text 委員長 部長好 在網路以及數位快速發展的時代我們一直有一個擔憂就是資訊安全的架構跟不上這樣一個網路數據的快速的這樣的一個流動的狀況 是 那近期我們看到有
transcript.whisperx[2].start 34.995
transcript.whisperx[2].end 61.511
transcript.whisperx[2].text 跨境電商以及政黨的各自外洩引起國人的這個相關的擔憂那我們看到在這樣一個狀況之下在技術的這樣的一個發展的過程裡面大家都急迫追求這樣一個商品短期開發的速度但是相關的技術的資安的這樣的一個配備
transcript.whisperx[3].start 62.472
transcript.whisperx[3].end 79.663
transcript.whisperx[3].text 以及準備是跟不上這樣的一個開發的速度所以我們看到有很多資安外洩的各自外洩的嚴重狀況那當然有兩個問題我們必須要去重視第一個都沒有辦法去及時發現這樣一個風險就是說都是透過這樣一個駭客
transcript.whisperx[4].start 83.786
transcript.whisperx[4].end 107.079
transcript.whisperx[4].text 警示或者是駭客已經提出勒索相關的這樣一個狀況才發覺治安有這樣的一個狀況另外一個就是在於我們這樣一個跨境電商他們的這個母公司都是在其他地方例如新加坡等等那我們這樣的一個跨境電商各自外洩
transcript.whisperx[5].start 108.467
transcript.whisperx[5].end 118.895
transcript.whisperx[5].text 全球總共有3370萬筆的資料會受到影響那確認台灣大概有20萬左右的用戶啊有遭到非法的一個接觸
transcript.whisperx[6].start 121.977
transcript.whisperx[6].end 141.213
transcript.whisperx[6].text 跨境電商號稱只有一名的台灣用戶資料遭到竊取或是儲存我們請數位部有加緊速度來瞭解這樣的一個狀況來保障民眾的個資我要請教一下部長 相關的這樣的一個調查狀況進度是如何
transcript.whisperx[7].start 143.115
transcript.whisperx[7].end 168.286
transcript.whisperx[7].text 是 這個事情那個就是之前我們發現這個案子以後我們就馬上去調查那剛開始就是這您所說的這個跨境電商跟我們講都沒有台灣的資料受到那個就是被存取那事實上後來我們那個經過我們庶產署不斷的努力之後我們請第三方的機構去認證就發現是說事實上的確是有超過20萬筆的資料被
transcript.whisperx[8].start 172.762
transcript.whisperx[8].end 196.761
transcript.whisperx[8].text 被存取那這邊想說所謂只有一名台灣用戶這個我必須說明這個是在那個犯案者的電腦上後面只找到一筆剩下一筆那個資料其他是被刪除了我們不知道但是其實我們據我們所知不只一筆不是只有一筆台灣的個資遭到那個遭到那個駭客的那個閱讀這個是必須跟委員說明
transcript.whisperx[9].start 197.321
transcript.whisperx[9].end 216.931
transcript.whisperx[9].text 那相關蘇華部對這件事情後續處理的態度是如何原則是如何對我們一切依法辦理那這件事情已經進入了這個法律的程序那我們會依照這個相關的法律那我們是不是請那個素產署蘇長說明是那檢調說明一下我們3月4號已經送行政院各支署
transcript.whisperx[10].start 217.771
transcript.whisperx[10].end 233.3
transcript.whisperx[10].text 然後我們把我們行政檢查的結果請這個那家跨境電商進行說明所以我們一切都在程序當中當然我們等行政院這邊召開會議來在會中說明保障民眾的個資這也是蘇衛部一個重要的責任
transcript.whisperx[11].start 234.761
transcript.whisperx[11].end 258.516
transcript.whisperx[11].text 必須要加緊相關的督促的工作另外我一再的提醒林部長我們對於數位主權的開發以及重視當然數化部現在已經建立了台灣主權AI的訓練餘料庫那大概規模大概是11億的2 case的這樣的一個資料的集中那來源大概涵蓋是200個政府機關
transcript.whisperx[12].start 261.98
transcript.whisperx[12].end 284.625
transcript.whisperx[12].text 我要請教部長說11億的2case相較於國際的這種主流模型動輒都是塑造的這樣的2case那差距是數千倍以上而且更關鍵的我們的羽料的這些來源是政府機關我想我們對於量少是一個問題
transcript.whisperx[13].start 286.585
transcript.whisperx[13].end 314.573
transcript.whisperx[13].text 偏差更是一個嚴重的問題因為你都集中在政府機關那我們量少又偏重在政府機關我們有什麼競爭力來部長說明一下首先要講說我們通常那種大型語料庫像Chad GP像Cloud這種語料庫他用的訓練資料量非常大但是裡面中文的資料量並沒有那麼多那我們現在遇到最大的困難是他大量使用中國的簡體中文的資料量那都是他們的那個觀點
transcript.whisperx[14].start 315.553
transcript.whisperx[14].end 341.951
transcript.whisperx[14].text 所以我們現在要加入繁體中文的資料量我們希望做一個平衡那11億個token聽起來很多但是其實相較起來我們當然覺得還不夠多所以我們接下來我們希望說在一直擴大我們現在是先從那個最簡單處理就是政府有著作權的資料包含中研院等資料我們放進來接下來我們希望民間也能提供一些資料那這個就是我們設計一個那個標準的授權條款讓民間
transcript.whisperx[15].start 346.514
transcript.whisperx[15].end 359.088
transcript.whisperx[15].text 能夠訓練出有獨立判斷的模型另外目前在3000多筆的資料集之中絕大部分都是政府的這種
transcript.whisperx[16].start 360.889
transcript.whisperx[16].end 386.759
transcript.whisperx[16].text 重複性很高低品質的這樣一個行政公報這樣對於台灣的數位主權提升還是有很大的一段距離我們有什麼改善的方式我們跟民間團體有進一步的合作嗎我們是否會編列預算像民間團體或是文學出版單位來採購或是武藏這樣的一個高品質的語料來說明一下
transcript.whisperx[17].start 387.6
transcript.whisperx[17].end 403.799
transcript.whisperx[17].text 這件事情我們之前跟這些大型語言模型的公司像Google等跟他們討論問他們說為什麼你都不用台灣的這個繁體中文語料他就跟我們講說兩個原因第一個是中國的簡體中文語料量比較大第一個量比較大
transcript.whisperx[18].start 404.019
transcript.whisperx[18].end 425.584
transcript.whisperx[18].text 第二個是因為中國那邊比較不注重著作財產權所以他們用那邊的語料去訓練就是很安全的不會有被告不會有任何的糾紛但是台灣是一個注重著作財產權的國家然後他們在乎的其實不是錢而是談判的成本因為他必須去跟每一家的那個每一個作者去談部長你現在就提到重點了
transcript.whisperx[19].start 426.244
transcript.whisperx[19].end 452.744
transcript.whisperx[19].text 相關於著作權我們對於數位主權未來的開發及訓練的過程裡面這是一個很嚴肅而且是一個很麻煩的議題那樹花不好在114年8月已經有提出相關的促進資料創新利用的發展條例它是一個草案那這項草案的核心就是在於開放資料跟共享資料
transcript.whisperx[20].start 453.464
transcript.whisperx[20].end 473.361
transcript.whisperx[20].text 那而且啊是引用一種概念叫資料利他的這樣的一個概念那鼓勵民間啊無償的提供相關的資料但是啊著作權法我們現行的草案沒有去處理到著作權法裡面啊從治權的一個爭議啊是沒錯就是說
transcript.whisperx[21].start 474.722
transcript.whisperx[21].end 496.532
transcript.whisperx[21].text 因為我們目前都是依賴這個很模糊的第65條有關於合理使用的這個條款那這個會讓主權AI的開發跟訓練面臨高風度的法律風險就是說住宿權法沒有提供
transcript.whisperx[22].start 497.577
transcript.whisperx[22].end 512.224
transcript.whisperx[22].text 明確的這樣的一個資料探勘的豁免那很容易我們國家花了數十億數十億開發的這種台版的大語言模型啊或是相關主權的模型啊
transcript.whisperx[23].start 513.605
transcript.whisperx[23].end 539.945
transcript.whisperx[23].text 他的訓練過程裡面會很容易陷入這種非法重製的這樣的一個灰色地帶如果民間團體他們集體來提告如果這種集體訴訟法院判定我們是侵權問題很嚴重因為國家級花了幾十億所建立的模型很容易就被法院下令要永久封存
transcript.whisperx[24].start 540.325
transcript.whisperx[24].end 562.271
transcript.whisperx[24].text 是或是所謂的銷毀權重就是刪除大量的相關內容是那這會陷入一個窘境啊是沒錯美處長你們要怎麼處理啊是事實上跟委員報告基本上這種由科技創新對著作財產權帶來的衝擊通常要少則要三五年才會塵埃落定因為現在有兩方都各
transcript.whisperx[25].start 562.811
transcript.whisperx[25].end 589.188
transcript.whisperx[25].text 各有道理一方面這個我們剛才講的AI產業希望能有大量的資料但是對於這個出版業還有文化界等等他們認為說這些AI模型不能無償的使用這些資料這在法律上會有一些爭議這個還在討論應該講說是討論那因為這是著作財產權是經濟部智慧財產局他們的主責那我們會密切的跟他們合作那我們在這個過程當中我們沒辦法處理
transcript.whisperx[26].start 590.188
transcript.whisperx[26].end 599.805
transcript.whisperx[26].text 因為這個整個討論要結束真的要三五年那我們現在先處理的就是比較沒有爭議的就是政府有鑄作財產權的部分這個就是我們現在在做的事情
transcript.whisperx[27].start 601.852
transcript.whisperx[27].end 627.686
transcript.whisperx[27].text 部長我們現在國際AI的競爭非常的快速主流都是已經進入到快速擴張起這個階段但是我們的數位主權在相關的訓練不管是資料來源或是相關著作權法裡面相關的爭議到現在都還沒有辦法進一步的處理這個數位部必須要加緊速度是 OK 謝謝委員提醒