iVOD / 167570

Field	Value
IVOD_ID	167570
IVOD_URL	https://ivod.ly.gov.tw/Play/Clip/1M/167570
日期	2026-03-18
會議資料.會議代碼	委員會-11-5-23-2
會議資料.會議代碼:str	第11屆第5會期交通委員會第2次全體委員會議
會議資料.屆	11
會議資料.會期	5
會議資料.會次	2
會議資料.種類	委員會
會議資料.委員會代碼[0]	23
會議資料.委員會代碼:str[0]	交通委員會
會議資料.標題	第11屆第5會期交通委員會第2次全體委員會議
影片種類	Clip
開始時間	2026-03-18T09:39:11+08:00
結束時間	2026-03-18T09:49:38+08:00
影片長度	00:10:27
支援功能[0]	ai-transcript
video_url	https://ivod-lyvod.cdn.hinet.net/vod_1/_definst_/mp4:1MClips/4e26a61b53ad6053a0b16607070185ca75f3d6415d2a29ea854b2f19bd25f7008ce2492c85169a165ea18f28b6918d91.mp4/playlist.m3u8
委員名稱	李昆澤
委員發言時間	09:39:11 - 09:49:38
會議時間	2026-03-18T09:00:00+08:00
會議名稱	立法院第11屆第5會期交通委員會第2次全體委員會議（事由：邀請數位發展部部長及國家科學及技術委員會主任委員就「落實臺灣AI治理與基礎建設，發展臺灣AI軟體產業」進行專題報告，並備質詢。【3月18日及19日二天一次會】）
transcript.pyannote[0].speaker	SPEAKER_02
transcript.pyannote[0].start	3.25409375
transcript.pyannote[0].end	5.76846875
transcript.pyannote[1].speaker	SPEAKER_02
transcript.pyannote[1].start	6.29159375
transcript.pyannote[1].end	7.60784375
transcript.pyannote[2].speaker	SPEAKER_02
transcript.pyannote[2].start	14.25659375
transcript.pyannote[2].end	14.83034375
transcript.pyannote[3].speaker	SPEAKER_02
transcript.pyannote[3].start	15.60659375
transcript.pyannote[3].end	32.04284375
transcript.pyannote[4].speaker	SPEAKER_02
transcript.pyannote[4].start	32.51534375
transcript.pyannote[4].end	34.33784375
transcript.pyannote[5].speaker	SPEAKER_02
transcript.pyannote[5].start	34.89471875
transcript.pyannote[5].end	96.23534375
transcript.pyannote[6].speaker	SPEAKER_00
transcript.pyannote[6].start	41.66159375
transcript.pyannote[6].end	42.11721875
transcript.pyannote[7].speaker	SPEAKER_02
transcript.pyannote[7].start	96.72471875
transcript.pyannote[7].end	106.37721875
transcript.pyannote[8].speaker	SPEAKER_00
transcript.pyannote[8].start	100.47096875
transcript.pyannote[8].end	101.14596875
transcript.pyannote[9].speaker	SPEAKER_02
transcript.pyannote[9].start	106.52909375
transcript.pyannote[9].end	107.71034375
transcript.pyannote[10].speaker	SPEAKER_02
transcript.pyannote[10].start	108.40221875
transcript.pyannote[10].end	120.18096875
transcript.pyannote[11].speaker	SPEAKER_02
transcript.pyannote[11].start	121.91909375
transcript.pyannote[11].end	123.82596875
transcript.pyannote[12].speaker	SPEAKER_02
transcript.pyannote[12].start	124.41659375
transcript.pyannote[12].end	142.91159375
transcript.pyannote[13].speaker	SPEAKER_00
transcript.pyannote[13].start	134.20409375
transcript.pyannote[13].end	135.08159375
transcript.pyannote[14].speaker	SPEAKER_00
transcript.pyannote[14].start	140.98784375
transcript.pyannote[14].end	141.30846875
transcript.pyannote[15].speaker	SPEAKER_00
transcript.pyannote[15].start	142.91159375
transcript.pyannote[15].end	142.92846875
transcript.pyannote[16].speaker	SPEAKER_02
transcript.pyannote[16].start	142.92846875
transcript.pyannote[16].end	142.94534375
transcript.pyannote[17].speaker	SPEAKER_00
transcript.pyannote[17].start	142.94534375
transcript.pyannote[17].end	157.30596875
transcript.pyannote[18].speaker	SPEAKER_00
transcript.pyannote[18].start	157.69409375
transcript.pyannote[18].end	172.03784375
transcript.pyannote[19].speaker	SPEAKER_00
transcript.pyannote[19].start	172.71284375
transcript.pyannote[19].end	180.84659375
transcript.pyannote[20].speaker	SPEAKER_00
transcript.pyannote[20].start	181.16721875
transcript.pyannote[20].end	197.28284375
transcript.pyannote[21].speaker	SPEAKER_02
transcript.pyannote[21].start	197.28284375
transcript.pyannote[21].end	202.02471875
transcript.pyannote[22].speaker	SPEAKER_00
transcript.pyannote[22].start	202.02471875
transcript.pyannote[22].end	213.07784375
transcript.pyannote[23].speaker	SPEAKER_01
transcript.pyannote[23].start	212.58846875
transcript.pyannote[23].end	213.38159375
transcript.pyannote[24].speaker	SPEAKER_01
transcript.pyannote[24].start	213.44909375
transcript.pyannote[24].end	217.16159375
transcript.pyannote[25].speaker	SPEAKER_01
transcript.pyannote[25].start	217.71846875
transcript.pyannote[25].end	229.26096875
transcript.pyannote[26].speaker	SPEAKER_02
transcript.pyannote[26].start	229.26096875
transcript.pyannote[26].end	229.42971875
transcript.pyannote[27].speaker	SPEAKER_01
transcript.pyannote[27].start	229.42971875
transcript.pyannote[27].end	229.90221875
transcript.pyannote[28].speaker	SPEAKER_02
transcript.pyannote[28].start	229.90221875
transcript.pyannote[28].end	249.19034375
transcript.pyannote[29].speaker	SPEAKER_00
transcript.pyannote[29].start	240.09471875
transcript.pyannote[29].end	240.41534375
transcript.pyannote[30].speaker	SPEAKER_02
transcript.pyannote[30].start	249.34221875
transcript.pyannote[30].end	261.42471875
transcript.pyannote[31].speaker	SPEAKER_00
transcript.pyannote[31].start	249.47721875
transcript.pyannote[31].end	249.69659375
transcript.pyannote[32].speaker	SPEAKER_00
transcript.pyannote[32].start	256.00784375
transcript.pyannote[32].end	256.34534375
transcript.pyannote[33].speaker	SPEAKER_02
transcript.pyannote[33].start	261.89721875
transcript.pyannote[33].end	286.06221875
transcript.pyannote[34].speaker	SPEAKER_00
transcript.pyannote[34].start	271.66784375
transcript.pyannote[34].end	272.05596875
transcript.pyannote[35].speaker	SPEAKER_02
transcript.pyannote[35].start	286.48409375
transcript.pyannote[35].end	296.47409375
transcript.pyannote[36].speaker	SPEAKER_00
transcript.pyannote[36].start	288.22221875
transcript.pyannote[36].end	288.93096875
transcript.pyannote[37].speaker	SPEAKER_00
transcript.pyannote[37].start	296.69346875
transcript.pyannote[37].end	344.29784375
transcript.pyannote[38].speaker	SPEAKER_02
transcript.pyannote[38].start	343.08284375
transcript.pyannote[38].end	386.95784375
transcript.pyannote[39].speaker	SPEAKER_00
transcript.pyannote[39].start	383.02596875
transcript.pyannote[39].end	383.04284375
transcript.pyannote[40].speaker	SPEAKER_00
transcript.pyannote[40].start	383.05971875
transcript.pyannote[40].end	383.12721875
transcript.pyannote[41].speaker	SPEAKER_00
transcript.pyannote[41].start	383.16096875
transcript.pyannote[41].end	383.17784375
transcript.pyannote[42].speaker	SPEAKER_00
transcript.pyannote[42].start	386.95784375
transcript.pyannote[42].end	424.74096875
transcript.pyannote[43].speaker	SPEAKER_02
transcript.pyannote[43].start	423.57659375
transcript.pyannote[43].end	464.43096875
transcript.pyannote[44].speaker	SPEAKER_00
transcript.pyannote[44].start	425.97284375
transcript.pyannote[44].end	426.27659375
transcript.pyannote[45].speaker	SPEAKER_00
transcript.pyannote[45].start	433.66784375
transcript.pyannote[45].end	434.05596875
transcript.pyannote[46].speaker	SPEAKER_00
transcript.pyannote[46].start	440.63721875
transcript.pyannote[46].end	440.82284375
transcript.pyannote[47].speaker	SPEAKER_00
transcript.pyannote[47].start	451.69034375
transcript.pyannote[47].end	451.75784375
transcript.pyannote[48].speaker	SPEAKER_00
transcript.pyannote[48].start	457.91721875
transcript.pyannote[48].end	458.62596875
transcript.pyannote[49].speaker	SPEAKER_00
transcript.pyannote[49].start	462.16971875
transcript.pyannote[49].end	462.22034375
transcript.pyannote[50].speaker	SPEAKER_00
transcript.pyannote[50].start	463.87409375
transcript.pyannote[50].end	463.89096875
transcript.pyannote[51].speaker	SPEAKER_00
transcript.pyannote[51].start	463.95846875
transcript.pyannote[51].end	464.22846875
transcript.pyannote[52].speaker	SPEAKER_02
transcript.pyannote[52].start	465.00471875
transcript.pyannote[52].end	473.10471875
transcript.pyannote[53].speaker	SPEAKER_00
transcript.pyannote[53].start	473.10471875
transcript.pyannote[53].end	473.49284375
transcript.pyannote[54].speaker	SPEAKER_02
transcript.pyannote[54].start	473.49284375
transcript.pyannote[54].end	473.61096875
transcript.pyannote[55].speaker	SPEAKER_00
transcript.pyannote[55].start	473.61096875
transcript.pyannote[55].end	475.60221875
transcript.pyannote[56].speaker	SPEAKER_02
transcript.pyannote[56].start	475.60221875
transcript.pyannote[56].end	485.89596875
transcript.pyannote[57].speaker	SPEAKER_00
transcript.pyannote[57].start	475.61909375
transcript.pyannote[57].end	476.26034375
transcript.pyannote[58].speaker	SPEAKER_02
transcript.pyannote[58].start	486.60471875
transcript.pyannote[58].end	494.90721875
transcript.pyannote[59].speaker	SPEAKER_02
transcript.pyannote[59].start	495.05909375
transcript.pyannote[59].end	496.96596875
transcript.pyannote[60].speaker	SPEAKER_02
transcript.pyannote[60].start	497.47221875
transcript.pyannote[60].end	502.24784375
transcript.pyannote[61].speaker	SPEAKER_02
transcript.pyannote[61].start	502.39971875
transcript.pyannote[61].end	512.59221875
transcript.pyannote[62].speaker	SPEAKER_00
transcript.pyannote[62].start	510.49971875
transcript.pyannote[62].end	510.82034375
transcript.pyannote[63].speaker	SPEAKER_02
transcript.pyannote[63].start	512.79471875
transcript.pyannote[63].end	544.95846875
transcript.pyannote[64].speaker	SPEAKER_00
transcript.pyannote[64].start	531.08721875
transcript.pyannote[64].end	532.36971875
transcript.pyannote[65].speaker	SPEAKER_00
transcript.pyannote[65].start	532.45409375
transcript.pyannote[65].end	532.97721875
transcript.pyannote[66].speaker	SPEAKER_00
transcript.pyannote[66].start	538.90034375
transcript.pyannote[66].end	539.30534375
transcript.pyannote[67].speaker	SPEAKER_00
transcript.pyannote[67].start	544.62096875
transcript.pyannote[67].end	544.77284375
transcript.pyannote[68].speaker	SPEAKER_02
transcript.pyannote[68].start	545.44784375
transcript.pyannote[68].end	550.25721875
transcript.pyannote[69].speaker	SPEAKER_00
transcript.pyannote[69].start	550.25721875
transcript.pyannote[69].end	589.35659375
transcript.pyannote[70].speaker	SPEAKER_00
transcript.pyannote[70].start	590.13284375
transcript.pyannote[70].end	600.07221875
transcript.pyannote[71].speaker	SPEAKER_00
transcript.pyannote[71].start	600.69659375
transcript.pyannote[71].end	601.28721875
transcript.pyannote[72].speaker	SPEAKER_02
transcript.pyannote[72].start	601.28721875
transcript.pyannote[72].end	601.43909375
transcript.pyannote[73].speaker	SPEAKER_02
transcript.pyannote[73].start	601.59096875
transcript.pyannote[73].end	601.67534375
transcript.pyannote[74].speaker	SPEAKER_00
transcript.pyannote[74].start	601.67534375
transcript.pyannote[74].end	601.96221875
transcript.pyannote[75].speaker	SPEAKER_02
transcript.pyannote[75].start	601.96221875
transcript.pyannote[75].end	627.86534375
transcript.pyannote[76].speaker	SPEAKER_00
transcript.pyannote[76].start	604.96596875
transcript.pyannote[76].end	605.30346875
transcript.pyannote[77].speaker	SPEAKER_00
transcript.pyannote[77].start	610.92284375
transcript.pyannote[77].end	611.61471875
transcript.whisperx[0].start	3.656
transcript.whisperx[0].end	7.351
transcript.whisperx[0].text	謝謝林俊憲召委請一下林部長我們邀請蘇澳部林部長
transcript.whisperx[1].start	14.318
transcript.whisperx[1].end	33.894
transcript.whisperx[1].text	委員長部長好在網路以及數位快速發展的時代我們一直有一個擔憂就是資訊安全的架構跟不上這樣一個網路數據的快速的這樣的一個流動的狀況是那近期我們看到有
transcript.whisperx[2].start	34.995
transcript.whisperx[2].end	61.511
transcript.whisperx[2].text	跨境電商以及政黨的各自外洩引起國人的這個相關的擔憂那我們看到在這樣一個狀況之下在技術的這樣的一個發展的過程裡面大家都急迫追求這樣一個商品短期開發的速度但是相關的技術的資安的這樣的一個配備
transcript.whisperx[3].start	62.472
transcript.whisperx[3].end	79.663
transcript.whisperx[3].text	以及準備是跟不上這樣的一個開發的速度所以我們看到有很多資安外洩的各自外洩的嚴重狀況那當然有兩個問題我們必須要去重視第一個都沒有辦法去及時發現這樣一個風險就是說都是透過這樣一個駭客
transcript.whisperx[4].start	83.786
transcript.whisperx[4].end	107.079
transcript.whisperx[4].text	警示或者是駭客已經提出勒索相關的這樣一個狀況才發覺治安有這樣的一個狀況另外一個就是在於我們這樣一個跨境電商他們的這個母公司都是在其他地方例如新加坡等等那我們這樣的一個跨境電商各自外洩
transcript.whisperx[5].start	108.467
transcript.whisperx[5].end	118.895
transcript.whisperx[5].text	全球總共有3370萬筆的資料會受到影響那確認台灣大概有20萬左右的用戶啊有遭到非法的一個接觸
transcript.whisperx[6].start	121.977
transcript.whisperx[6].end	141.213
transcript.whisperx[6].text	跨境電商號稱只有一名的台灣用戶資料遭到竊取或是儲存我們請數位部有加緊速度來瞭解這樣的一個狀況來保障民眾的個資我要請教一下部長相關的這樣的一個調查狀況進度是如何
transcript.whisperx[7].start	143.115
transcript.whisperx[7].end	168.286
transcript.whisperx[7].text	是這個事情那個就是之前我們發現這個案子以後我們就馬上去調查那剛開始就是這您所說的這個跨境電商跟我們講都沒有台灣的資料受到那個就是被存取那事實上後來我們那個經過我們庶產署不斷的努力之後我們請第三方的機構去認證就發現是說事實上的確是有超過20萬筆的資料被
transcript.whisperx[8].start	172.762
transcript.whisperx[8].end	196.761
transcript.whisperx[8].text	被存取那這邊想說所謂只有一名台灣用戶這個我必須說明這個是在那個犯案者的電腦上後面只找到一筆剩下一筆那個資料其他是被刪除了我們不知道但是其實我們據我們所知不只一筆不是只有一筆台灣的個資遭到那個遭到那個駭客的那個閱讀這個是必須跟委員說明
transcript.whisperx[9].start	197.321
transcript.whisperx[9].end	216.931
transcript.whisperx[9].text	那相關蘇華部對這件事情後續處理的態度是如何原則是如何對我們一切依法辦理那這件事情已經進入了這個法律的程序那我們會依照這個相關的法律那我們是不是請那個素產署蘇長說明是那檢調說明一下我們3月4號已經送行政院各支署
transcript.whisperx[10].start	217.771
transcript.whisperx[10].end	233.3
transcript.whisperx[10].text	然後我們把我們行政檢查的結果請這個那家跨境電商進行說明所以我們一切都在程序當中當然我們等行政院這邊召開會議來在會中說明保障民眾的個資這也是蘇衛部一個重要的責任
transcript.whisperx[11].start	234.761
transcript.whisperx[11].end	258.516
transcript.whisperx[11].text	必須要加緊相關的督促的工作另外我一再的提醒林部長我們對於數位主權的開發以及重視當然數化部現在已經建立了台灣主權AI的訓練餘料庫那大概規模大概是11億的2 case的這樣的一個資料的集中那來源大概涵蓋是200個政府機關
transcript.whisperx[12].start	261.98
transcript.whisperx[12].end	284.625
transcript.whisperx[12].text	我要請教部長說11億的2case相較於國際的這種主流模型動輒都是塑造的這樣的2case那差距是數千倍以上而且更關鍵的我們的羽料的這些來源是政府機關我想我們對於量少是一個問題
transcript.whisperx[13].start	286.585
transcript.whisperx[13].end	314.573
transcript.whisperx[13].text	偏差更是一個嚴重的問題因為你都集中在政府機關那我們量少又偏重在政府機關我們有什麼競爭力來部長說明一下首先要講說我們通常那種大型語料庫像Chad GP像Cloud這種語料庫他用的訓練資料量非常大但是裡面中文的資料量並沒有那麼多那我們現在遇到最大的困難是他大量使用中國的簡體中文的資料量那都是他們的那個觀點
transcript.whisperx[14].start	315.553
transcript.whisperx[14].end	341.951
transcript.whisperx[14].text	所以我們現在要加入繁體中文的資料量我們希望做一個平衡那11億個token聽起來很多但是其實相較起來我們當然覺得還不夠多所以我們接下來我們希望說在一直擴大我們現在是先從那個最簡單處理就是政府有著作權的資料包含中研院等資料我們放進來接下來我們希望民間也能提供一些資料那這個就是我們設計一個那個標準的授權條款讓民間
transcript.whisperx[15].start	346.514
transcript.whisperx[15].end	359.088
transcript.whisperx[15].text	能夠訓練出有獨立判斷的模型另外目前在3000多筆的資料集之中絕大部分都是政府的這種
transcript.whisperx[16].start	360.889
transcript.whisperx[16].end	386.759
transcript.whisperx[16].text	重複性很高低品質的這樣一個行政公報這樣對於台灣的數位主權提升還是有很大的一段距離我們有什麼改善的方式我們跟民間團體有進一步的合作嗎我們是否會編列預算像民間團體或是文學出版單位來採購或是武藏這樣的一個高品質的語料來說明一下
transcript.whisperx[17].start	387.6
transcript.whisperx[17].end	403.799
transcript.whisperx[17].text	這件事情我們之前跟這些大型語言模型的公司像Google等跟他們討論問他們說為什麼你都不用台灣的這個繁體中文語料他就跟我們講說兩個原因第一個是中國的簡體中文語料量比較大第一個量比較大
transcript.whisperx[18].start	404.019
transcript.whisperx[18].end	425.584
transcript.whisperx[18].text	第二個是因為中國那邊比較不注重著作財產權所以他們用那邊的語料去訓練就是很安全的不會有被告不會有任何的糾紛但是台灣是一個注重著作財產權的國家然後他們在乎的其實不是錢而是談判的成本因為他必須去跟每一家的那個每一個作者去談部長你現在就提到重點了
transcript.whisperx[19].start	426.244
transcript.whisperx[19].end	452.744
transcript.whisperx[19].text	相關於著作權我們對於數位主權未來的開發及訓練的過程裡面這是一個很嚴肅而且是一個很麻煩的議題那樹花不好在114年8月已經有提出相關的促進資料創新利用的發展條例它是一個草案那這項草案的核心就是在於開放資料跟共享資料
transcript.whisperx[20].start	453.464
transcript.whisperx[20].end	473.361
transcript.whisperx[20].text	那而且啊是引用一種概念叫資料利他的這樣的一個概念那鼓勵民間啊無償的提供相關的資料但是啊著作權法我們現行的草案沒有去處理到著作權法裡面啊從治權的一個爭議啊是沒錯就是說
transcript.whisperx[21].start	474.722
transcript.whisperx[21].end	496.532
transcript.whisperx[21].text	因為我們目前都是依賴這個很模糊的第65條有關於合理使用的這個條款那這個會讓主權AI的開發跟訓練面臨高風度的法律風險就是說住宿權法沒有提供
transcript.whisperx[22].start	497.577
transcript.whisperx[22].end	512.224
transcript.whisperx[22].text	明確的這樣的一個資料探勘的豁免那很容易我們國家花了數十億數十億開發的這種台版的大語言模型啊或是相關主權的模型啊
transcript.whisperx[23].start	513.605
transcript.whisperx[23].end	539.945
transcript.whisperx[23].text	他的訓練過程裡面會很容易陷入這種非法重製的這樣的一個灰色地帶如果民間團體他們集體來提告如果這種集體訴訟法院判定我們是侵權問題很嚴重因為國家級花了幾十億所建立的模型很容易就被法院下令要永久封存
transcript.whisperx[24].start	540.325
transcript.whisperx[24].end	562.271
transcript.whisperx[24].text	是或是所謂的銷毀權重就是刪除大量的相關內容是那這會陷入一個窘境啊是沒錯美處長你們要怎麼處理啊是事實上跟委員報告基本上這種由科技創新對著作財產權帶來的衝擊通常要少則要三五年才會塵埃落定因為現在有兩方都各
transcript.whisperx[25].start	562.811
transcript.whisperx[25].end	589.188
transcript.whisperx[25].text	各有道理一方面這個我們剛才講的AI產業希望能有大量的資料但是對於這個出版業還有文化界等等他們認為說這些AI模型不能無償的使用這些資料這在法律上會有一些爭議這個還在討論應該講說是討論那因為這是著作財產權是經濟部智慧財產局他們的主責那我們會密切的跟他們合作那我們在這個過程當中我們沒辦法處理
transcript.whisperx[26].start	590.188
transcript.whisperx[26].end	599.805
transcript.whisperx[26].text	因為這個整個討論要結束真的要三五年那我們現在先處理的就是比較沒有爭議的就是政府有鑄作財產權的部分這個就是我們現在在做的事情
transcript.whisperx[27].start	601.852
transcript.whisperx[27].end	627.686
transcript.whisperx[27].text	部長我們現在國際AI的競爭非常的快速主流都是已經進入到快速擴張起這個階段但是我們的數位主權在相關的訓練不管是資料來源或是相關著作權法裡面相關的爭議到現在都還沒有辦法進一步的處理這個數位部必須要加緊速度是 OK 謝謝委員提醒