iVOD / 168903

本逐字稿內容由 AI 自動生成，可能包含錯誤、遺漏或誤譯之處。請使用者務必與原始影片音訊內容交叉比對，以確保資訊正確性。另可參考立法院日後釋出的正式公報以取得最終權威版本。

郭昱晴 @ 第11屆第5會期教育及文化委員會第8次全體委員會議

Start Time	End Time	Text
00:00:00,389	00:00:01,110	請機關代表到備訓台謝謝
00:00:22,850	00:00:37,595	三位早安我想這個問題應該是跨部會所以把你們三個先叫上來不好意思我想今天要談三個主題核心重點就再問一件事情就是台灣的AI到底有沒有一套真正的國家的戰略
00:00:38,255	00:00:57,310	那我為什麼要這麼說呢我想第一部分AI其實不是三塊的拼圖那剛剛也提到它應該是一個所謂的系統那目前其實台灣的AI發展大致分為三塊那我來敘述一下不曉得對不對三位可以指教那我想國科會是做科研模型跟學門
00:00:57,970	00:01:15,351	好然後再來中研院我們做的是學術的標準還有倫理的部分那術發部的部分我們是做應用資料跟治理我想這個應該沒有錯齁這個三個部分那看起來這個分工其實是很清楚啦但是其實我想要問的是我們擔心喔就是各做各的
00:01:15,751	00:01:43,460	那沒有整合那我舉幾個比較實際的一個例子我想學門其實是傳統的分科但是AI其實剛剛一經委員也特別提到它所謂的是跨領域的那另外在倫理的部分目前大部分我們都是用指引的方式但並沒有真正的所謂的制度那AI已經進入到了這個政府跟產業但是在透明的機制上可能還沒有辦法完全的補足那沒有辦法完全跟上
00:01:43,800	00:02:04,777	那從研究一直到應用這中間銜接的責任目前為止大家感覺好像還不是那麼的清楚那我首先想請教的是目前有沒有一個所謂的跨部會的統整的機制然後再來就是到底是誰來做最後的決策這個權責我們大致上是怎麼樣分的好請教
00:02:06,844	00:02:24,950	跟委員報告目前行政院我們有一個叫做三政委平台我們叫做法治名詞我就不是記得很清楚但是是由國發會主委國科會主委還有法治政委三個政委是共同主持的一個會議會去做一個跨部會的一個協商
00:02:25,450	00:02:32,453	所以它只是一個會議而已嗎它是一個協商平台最後的決策其實還是會到行政院應該是由行政院這邊來做最後決策那我再問一個更關鍵的一個問題好了
00:02:42,517	00:03:10,767	那我想這個AI已經進入所謂的高風險的一個領域啦比方說像是公共治理醫療法律還有現在所謂的這個倫理的一個規範那我想還停留在所謂的這個學界的自律那問題是將來這個會不會讓它制度化我比方說像是分級的一些制度的管理啦或者是強制的風險的一個評估那政府在使用AI的時候我們需不需要隨時向民眾來做揭露那目前有沒有一個比較明確
00:03:11,587	00:03:38,899	或者是一個進程還有規劃的這個整個所有的這個就是行程大概是怎麼樣是跟委員報告就這個各個部會主管機關去對產業做的這個規範我們就是會透過風險分類框架去協助各部會做盤點那在這個政府機關沒有強制對不對這個部分是目前沒有強制
00:03:40,854	00:03:58,680	應該說我們的只是一個指引對是指引但是各部會都積極在配合對我們都在非常這個平凡的在溝通跟協作的過程中那有一個就是基本法裡面設定的時間點是這個兩年嘛
00:04:00,981	00:04:25,824	那但是有一些比較重要的就是說風險比較明確的這個我想會在比較快的時間時間底下會有一個比較早的這個決定就是有一些部會他們可能會比較早完成這個整個法規的修訂那另外在政府機關的部分數發部的這個數位政府
00:04:26,424	00:04:38,616	也在協助政府機關去做這個內控的部分這個我們也在積極進行當中那應該是法規底下基本法也是要求附帶決議是要求六個月內六個月內
00:04:41,707	00:05:02,005	那再来接下来第二个部分我想要问的是这个主权AI的核心就是刚刚其实有几位委员有特别提到就是所谓的语料跟资料的主权主导权这个部分那我想呢谈到这个台德我从2024年其实一直在追那我一直在强调的一句话就是说主权AI它不只是模型
00:05:02,625	00:05:27,938	它其實也是包含資料、算力還有長期的維運那現在其實我們面對一個比較現實的一個狀況是我們看到這個台灣的合法的語料大概是100GB那另外呢在日本呢其實大概是25pp那全球的中文的語料90%是來自於中國那換句話來說我們在用AI
00:05:28,618	00:05:51,279	可是資料的主權居然不在自己的手上我想這個部分大家都會有一些隱憂我想這個問題是不管是語料模型應用還是分三邊在做語料是書發部那內容的部分應該是中研院對不對那模型的部分是國科會好又來了這個三個感覺都分工了都很細
00:05:51,980	00:06:10,839	但問題是我們現在在講的是中間會不會缺少一條所謂的整體的戰略的主軸那這個部分請問誰來回答我一下目前我們到底有沒有主權AI的整體的戰略的整合的機制然後再來我們又是怎麼樣三個部會是怎麼樣來做分工協作的來
00:06:12,221	00:06:36,759	其實這一塊雖然是分三個單位在做其實我們是一起在努力啦所以模型這一塊雖然是國科會在主導但是其實我們也是跟中研院在合作在做開發跟推動那既然是三個部分都有在做三個部會我們都有在做那請問我們這個具體的一些魚料的建設的一個目標啦我要問一下這個目標了我們要做到多少量
00:06:37,239	00:07:00,982	我們要幾年完成然後再聊我們能不能夠支撐下一代的這個模型的部分這個誰可以回答我跟委員報告這個語料的部分我們在法規上有非常大的限制我想這個委員也應該清楚因為台灣的駐作權法的這個規定還有合理使用我們有沒有一個目標我們在這個
00:07:02,763	00:07:29,571	數位部現在在草擬這個資料創新發展利用條例底下希望有一些能夠有一些突破那我們現在也在積極溝通當中那另外就是說我們目前能做的是透過語料庫的建立設計一定的授權機制那首先邀請各部會來提供語料那另外今年開始我們也邀請民間廠商能夠依據這個授權機制來把他們的語料放進這個主權語料庫裡面那當然
00:07:33,553	00:07:47,343	希望能夠持續推進如果在法規上面有更大的突破有沒有預計什麼時程可以完成或者是完成多少的目標那另外剛剛有提到所謂的語料的部分其實包含我們現在講語料
00:07:48,524	00:08:09,236	大部分是所謂的這個科普跟學科啦科普跟學科但是問題是我們有很大很重要的一個關鍵是產業資料跟實務上的一個資料我們怎麼樣讓這個部分也能夠進入到所謂的AI的訓練有沒有一些制度或有一些誘因能夠來吸引所謂的這個這樣子的一個方向啦
00:08:10,397	00:08:31,313	是跟委员报告就是有关于这个语料库呢速发布在去年年底的时候12月24号之后公布上线那目前的语料量是1.2billion tokens那当然我们是语料库的这个升级我们是先从中央政府开始那在今年呢年初的时候呢我们就朝地方政府迈进所以会有很多这个在地的语料一起进来
00:08:31,693	00:08:56,985	那我們在今年下半年會針對這個民間的這個雨量開始進行徵集所以我們是有系統有步驟的方式來擴大我們的雨量量那我覺得這個雨量是沒有止盡的一天了我們會努力的不斷的把這個雨量量擴大那這個盤點的一些資訊是不是可以公開可以提供然後再來有沒有變成一個所謂的這個成效評估的一個機制就是它變成一個可以一直不斷的被複製一直不斷被修正這樣子的一個機制委員的建議非常的好
00:08:57,225	00:09:14,162	就是说我们在中央跟地方政府这个部分我们都有开工作坊请他们来进行定期的盘点那我们在年底的时候呢我会有一个评奖的机制所谓的机制大概是多久就是大概就是说我们大概每两三个月就请他们盘一次那盘一次我们会有协作的方式把他们的请他们把资料放到这个预料库上面来
00:09:14,602	00:09:40,096	那我們在年底的時候呢我會有個評獎的一個機制看看中央跟地方政府還有這些民間團體他們這個努力的成果所以有一些誘因就對了對會有一個頒獎的一個機制這樣子好如果有一些比較具體的一些計畫就像您剛剛所說的這些內容其實是很豐富的那這些具體的計畫可以再提供給我辦公室嗎可以我們會整理一份資料給委員辦公室參考好謝謝好謝謝主席好謝謝郭益群委員的資訊