0 |
張委員雅琳:(10時52分)謝謝主席。有請主委。 |
1 |
主席:有請吳主委。 |
2 |
吳主任委員誠文:委員好。 |
3 |
張委員雅琳:主委好。剛剛有委員問到有關於兒童教育在AI這一段,我就此延伸來提醒一下。2016年世界經濟論壇已經提出報告提醒大家:面對AI,孩子需要具備的能力是什麼?如何在AI世代成為世界上極具有競爭力的人才?其實是透過遊戲!因為在遊戲之中有充分的創造力練習,這是現在AI所沒有辦法取代的。所以我們雖然要關注兒童的教育面,但我希望我們要非常謹慎,不要投入太多的AI課程,反而剝奪了兒童遊戲的時間,如此將無法在AI世代存活下來,這是從2016年開始世界經濟論壇所給予的一個很大的提醒。 |
4 |
接下來我就進入今天的重點。這幾天大家應該都非常瞭解,黃仁勳在演講中一直不停強調:臺灣是無名英雄,是世界的支柱,這感染了、也鼓舞了所有的臺灣人。同時,接下來有一系列,不管是AMD或超微都宣布要投資臺灣,一瞬間,臺灣變成了世界中心!臺北市電腦公會理事長提到有三個重點需要面對:第一個就是算力;第二個是電力;第三個是人力。上次我在質詢經濟部時有提到,我們有沒有把AI需要的電力算進去?由於現在大家大幅加碼投資,剛剛也有委員提到一堆算力中心要進來了,所以我想請教主委,因為算力非常需要電力,我們之前在做估算時,有沒有把這些電力的規劃都放進去呢?有沒有協助經濟部來做這些規劃呢? |
5 |
吳主任委員誠文:有。報告委員,我們跟經濟部一直密切在溝通,在經濟部所提出來的規劃裡,其實未來幾年,我們依照現在AI的需求以及半導體製造的需求,有關電力的需求是一直在成長的。在成長過程當中,我們會盡力去開發綠電。以目前規劃當中的綠電來說,希望將來短期內,現在所預計要增建的這些算力、超級電腦,能夠符合現在經濟部的規劃,所以目前經濟部的報告是沒有問題,電力是充足的。 |
6 |
張委員雅琳:因為AI的進步成長迅速,雖說好像我們算力增加,效能增加,電力也沒用到這麼多,但我覺得我們還是要時時去保持,並計算出相對的電力需求,確保我們的產業還有AI算力中心都可以持續、好好的運作。 |
7 |
吳主任委員誠文:謝謝委員。 |
8 |
張委員雅琳:再來,我們在112年有提出晶片驅動臺灣創新產業的方案,也投入了三千多億來挹注生成式AI的關鍵技術,也說要調查百工百業對AI的需求,並以機械業為示範案例,建立資料共享機制。我想要瞭解,目前針對百工百業雖然從112年開始,但接下來的規劃、目前的進度是什麼?有沒有詳細的推廣……大概要什麼時候、要推廣到多少產業? |
9 |
吳主任委員誠文:我在上個月接任時有跟媒體宣布過,我們在三個月內要規劃出方案來。 |
10 |
張委員雅琳:三個月內,是嗎? |
11 |
吳主任委員誠文:三個月內…… |
12 |
張委員雅琳:之後規劃出方案時,可不可以提供給我們? |
13 |
吳主任委員誠文:當然,一定也會在這邊跟委員報告。 |
14 |
張委員雅琳:接下來我想要再提醒,不知道主委有沒有看過這一份報告?也就是去年一個有關AI產業化大調查的報告?不知道主委看過這份報告嗎? |
15 |
吳主任委員誠文:這份報告我個人沒有看過。 |
16 |
張委員雅琳:沒關係,我希望之後主委可以看一下。我剛剛講到百工百業,這裡其實就講到他們去調查了四種不同的產業:製造業、專業服務業、ICP產業等等,裡面有講到他們去瞭解到底有多少企業導入了AI。目前看起來雖然有過半數好像已經導入,但也有近半數完全沒有導入。所以就變成我們要如何協助大家做使用將會是一個很重要的重點,尤其臺灣有非常多的中小企業。你可以看一下這張圖,臺灣製造業的AI化指數差異很大,可能在資訊流通業、ICT產業很高,圖表的黑色虛點線是平均值;但製造業、政府機關以及零售、貿易服務業都低於平均,所以這一塊非常需要主委的協助!我自己也看了一些報導,都說製造業可以導入AI模型來輔助增進產線的生產效率,提升良率、預防性維修,這些都是好處。不過人工智慧學校校長孔祥重院士提到,現在政府的資料其實是有問題的!我們的原始資料不明,是什麼樣的資料、何時蒐集、是否經過整理等這些都不清楚。其次,也不知道資料到底放在哪裡!伺服器經常壞掉,許多實驗產出數據、寫完兩篇論文之後,資料就不知道在哪裡了!第三,授權規格不明還有是否定期維護,所以就變成政府說有資料,但都沒有整理成AI模型可以使用的,所以都不算真的資料。如果以這個標準來看,可用的資料其實非常少,就會很難做出AI模型。因此他有三個建議,也就是我們是不是可以把這個資料整理清楚,建立產業模型來養技職人才;如果是通用資料,就用通用模型給一般人,專業領域如製造業、醫療業,就做出專業模型給產業用,所以我上次才一直提到半導體產業。我想要瞭解的是,之前主委有講資料是很重要的,那我們現在提供的、可用的資料規劃進度又是什麼? |
17 |
吳主任委員誠文:我可以請數位部來回答嗎? |
18 |
張委員雅琳:可以。 |
19 |
葉次長寧:跟委員報告,本部有關資料治理的部分是由多元創新司負責。委員剛剛說的非常正確,目前政府的資料狀況是還在比較初階的階段,所以我們會爭取公共建設計畫來做所謂的資料圖譜(Data Fabric),讓各個政府資料的整個圖像變得比較清楚。這樣相對來講,不管是要進行資料串接、應用服務也好,或是AI訓練也好,都能夠有一個比較標準的規格。也同時知道這樣的資料大概會在什麼地方可以找得到,這是我們正在努力的方向。 |
20 |
張委員雅琳:我想問一下,這個公建計畫大概是什麼時候會確認有這筆預算,因為這個非常影響我們的百工百業到底有沒有東西可以用。 |
21 |
葉次長寧:是的,我們現在在爭取114年的計畫。 |
22 |
張委員雅琳:114年?那我們相對的一些詳細的規劃現在是有了對不對? |
23 |
葉次長寧:我們現在在進行規劃中。 |
24 |
張委員雅琳:那進行規劃之後是不是也可以提供給我?我們可以做一些討論,好不好? |
25 |
葉次長寧:可以,沒有問題。 |
26 |
張委員雅琳:再來就是,因為我的時間有一點不太夠,我要講一個重點,其實今天委員也都有提到,到底我們要不要持續對TAIDE做投資。我自己來看,圖靈獎得主主導Meta AI研究的科學家Yann LeCun就有講,不要研究大型語言模型,上次其實我也有跟主委講,我們應該要專精於本土的語言模型,這才是我們最具有競爭優勢的地方。 |
27 |
我其實看了剛剛那一份AI產業化的報告,我也發現資訊業、製造業他們有導入的那些企業所使用的就是ChatGPT、Midjourney這種東西,所以其實是跟TAIDE有相關,我們是有競爭優勢的。但是有一個提醒,金融時報在5月22號報導中國近期透過一些官方訓練他們自己的ChatGPT,叫做「Chat Xi PT」。這是金融時報說的,因為它主要的訓練素材是習近平新時代中國特色社會主義思想資料庫,習思想是由14條原則來組成的,包括保證中國共產黨絕對掌權,加強國家安全和社會主義價值觀,所以它今天產出的內容其實會造成很大偏頗的問題、有不中立的問題。 |
28 |
剛剛好今天國語日報也講到了這一點,所以這一點我想請主委或者是誰可以來回答我,當世界都在發展AI的時候,我們今天在做本土語言模型的時候,要如何確保我們的資料不是偏頗的? |
29 |
吳主任委員誠文:非常同意委員的觀點,其實大型語言模型不是萬靈丹,它是非常耗資源、耗能源的一種做法,是一種統計性的方式,需要大量的資料,非常大的模型、耗大量的電力、算力才有辦法做出答案,但是它的答案卻又不是百分之百準確,也不是所有的應用都適合。 |
30 |
張委員雅琳:沒錯。 |
31 |
吳主任委員誠文:我們現在泛講AI,AI有很多種方式,所以我們要混合其他的方式,不一定全部都是用這種大型語言模型。 |
32 |
張委員雅琳:沒錯,我同意。 |
33 |
吳主任委員誠文:所以委員的觀點非常好,我們要兼顧能源的有效使用,人才的有效使用、模型的優化、資料的準確度,將來在各行各業的應用,我們會去協助他們做比較有效率的發展,很同意委員的觀點。 |
34 |
張委員雅琳:對,但我想要知道,因為剛剛其實有講了,我也非常認同,就是我們應該要做出一些差異化,而且是真正適合臺灣產業使用的。當然就是說,我先延伸一下這一點,我們應該要跟企業合作,開發更多的應用情境來協助企業使用這個生成式AI。但是也是要坦白說,也要有一定開發能力的企業才有辦法自己開發出來,所以是不是也……因為目前TAIDE還是一整包資料,未來也希望是不是可以開放出來,這是可以來討論的。 |
35 |
吳主任委員誠文:好,謝謝。 |
36 |
張委員雅琳:但是回到「偏頗」的問題,我們要如何確保現在所訓練的資料沒有偏頗性的問題。 |
37 |
吳主任委員誠文:是,謝謝。 |
38 |
張委員雅琳:這個部分現在是可以再做一下說明嗎? |
39 |
楊執行秘書佳玲:跟委員報告一下,我們所謂的TAIDE,因為trustworthy確定資料不偏頗是我們的一個滿重要的任務。 |
40 |
張委員雅琳:對。 |
41 |
楊執行秘書佳玲:未來數位部的評測中心其實也會做這方面的檢測,所以這是我們很注意的一個重點,在發展TAIDE的時候。 |
42 |
張委員雅琳:所以這個檢測性的頻率是多久呢? |
43 |
楊執行秘書佳玲:資料進來的時候要經過評測中心檢測這個資料有沒有偏頗。 |
44 |
張委員雅琳:所以這跟114年的公建計畫也非常有關係,對不對? |
45 |
楊執行秘書佳玲:是。 |
46 |
張委員雅琳:謝謝。 |
47 |
吳主任委員誠文:謝謝委員。 |
48 |
主席:謝謝張雅琳委員,主委請回。 |
49 |
我們接下來請AI博士葛如鈞委員。 |