0 |
張委員雅琳:(10時49分)謝謝主席,有請我們的副主委,謝謝。 |
1 |
主席:好,有請林副主委。 |
2 |
林副主任委員敏聰:委員早安。 |
3 |
張委員雅琳:副主委早安。上次我們在討論TAIDE這個計畫的時候,是有講到我們現在正在開發所謂的學研版本,它有非常多不錯的功能,但是我也發現這個計畫中有一個很有趣的部分,也是我自己長期關注的所謂母語教育的部分。就是現在國科會是在建構正體中文的版本,同時也有在使用基於13B的學研版本來訓練臺語與客語的ChatGPT,希望未來可以應用在中小學的母語教育,來協助推廣母語教育。因為在訓練這種語言模型的時候,最重要的就是資料庫,我知道目前使用的資料庫就有台灣媠聲資料集,還有臺華台平行語料庫、客委會語音資料庫、客語能力認證資料庫,但是我看了我們公布在網站的訓練資料,幾乎都是正體中文的版本,這樣子的訓練資料量是足夠的嗎? |
4 |
林副主任委員敏聰:我想這個部分當然就是如同委員上面寫的,客語這個部分當然有特殊的資料庫,我們會積極去爭取,目前我們是儘量把已經可以授權的資料庫先放進去,而且TAIDE本身的資料庫很重要,它就是希望建立正體字本身,就繁體字本身這個資料庫,因為所有資料庫的背後都有社會文化的關係,所以這個是我們建立TAIDE非常重要的一個部分,具體來講夠不夠,請副執行秘書簡單回答。 |
5 |
林副執行秘書明仁:跟委員報告,我想您說的沒錯,資料的訓練其實資料量就是最重要的,我們第一步開始當然是先充正體中文,包含臺語、客語、原住民母語的部分也都有在思考,可是的確那個語料從哪裡來,比如我們就會找客委會,問他們是不是有一些語言認證,那個就是,就會拉進來…… |
6 |
張委員雅琳:我們未來還會有更多的訓練資料庫嗎?因為像文化部這幾年也產出非常多相關的…… |
7 |
林副執行秘書明仁:會、會。 |
8 |
張委員雅琳:客委會、原委會都有相關的一些教材,這些東西是不是都可以儘快地納進來,一起來做…… |
9 |
林副執行秘書明仁:是,這個團隊都有很努力在跟各部會就資料協商,但它背後有著作權的問題需要解決。 |
10 |
張委員雅琳:對,針對這件事情,你們有一個期程的規劃嗎? |
11 |
林副執行秘書明仁:我們第一期是4月底7B會先釋出,那案子就…… |
12 |
張委員雅琳:我知道,但是我是針對於母語訓練的部分。 |
13 |
林副執行秘書明仁:如果有新的案子的話,我們就會再繼續找母語,繼續再加強這方面的訓練。 |
14 |
張委員雅琳:新的案子指的意思是什麼?是我們現在還沒有規劃,是未來再規劃的意思嗎? |
15 |
林副執行秘書明仁:有規劃了。 |
16 |
張委員雅琳:有規劃。 |
17 |
林副主任委員敏聰:這個會持續。 |
18 |
林副執行秘書明仁:這個一定會持續。 |
19 |
張委員雅琳:這個會持續,好,那有沒有一些相關的資料,就如果你現在已經有些規劃期程的話,是不是也可以提供到我們辦公室,好不好? |
20 |
林副執行秘書明仁:好,沒有問題。 |
21 |
張委員雅琳:謝謝。 |
22 |
再來,在這個訓練的資料裡面,像是國科會「科技大觀園」網站的資料,我是可以用臺語詢問ChatGPT關於科學的知識,會獲得臺語的回答嗎? |
23 |
林副主任委員敏聰:我們希望有一天可以用不同的語言來回答,但目前可能還沒有,這是一個很好的提議…… |
24 |
張委員雅琳:那我們可不可以往這個方向,好不好? |
25 |
林副主任委員敏聰:對、對、對…… |
26 |
張委員雅琳:不然,你已經做了這個…… |
27 |
林副主任委員敏聰:就真的用不同語言輸入,然後它就可以回答,這個應該是要。 |
28 |
張委員雅琳:好不好?我們往這個方向,因為你也都把一些語言認證的東西放進去了,我們往這個方向來努力…… |
29 |
林副主任委員敏聰:對,這樣會很有感。 |
30 |
張委員雅琳:對。再來,之前也有講到臺語版正在導入中小學臺語教學的應用案例,在臺南大學就有將臺語的這個模型出版,導入臺語對話的生成式AI,在仁德國小做臺語教學,我想要知道,目前是希望可以把這個機器人的對話能力提升到國小中高年級,來幫助學生學臺語,那我們現在相關的像客語或其他國家語言也是有這個方向,讓它可以成為幫助學生學臺語的嗎?這個也是有嗎? |
31 |
林副執行秘書明仁:這個後面我們就持續規劃。 |
32 |
張委員雅琳:這個也是有一些相關的規劃期程已經出來了嗎? |
33 |
林副執行秘書明仁:目前還沒有。 |
34 |
張委員雅琳:目前還沒有。 |
35 |
林副主任委員敏聰:目前還沒有,我想有很多的應用,如果把這個平台建立起來,這個能力建立起來,因為我們是建立核心的引擎,輸入重要的資料,如果這個起來以後…… |
36 |
張委員雅琳:我懂,但是因為13B已經開始做這個部分了嘛! |
37 |
林副主任委員敏聰:對,我們就可以跟其他的應用面連結,它就可以應用這個資料庫來做剛剛委員提供的這些很多很多的應用面。 |
38 |
張委員雅琳:好,我想問一下,這台AI機器人有沒有辦法導入更多學校? |
39 |
林副主任委員敏聰:這台機器人…… |
40 |
張委員雅琳:因為目前只有一個學校,未來有可能…… |
41 |
林副主任委員敏聰:我覺得這是一個方向,如果未來…… |
42 |
張委員雅琳:對,因為我們既然講要母語教學,只有一台,太少了吧! |
43 |
林副主任委員敏聰:也可以透過網站,就有很多東西是透過網站或者其他部分,因為這個牽扯到AI的硬體,進入學校,這個還要跟教育部什麼之類的要連結,看能不能把這個技術引進到他們常規性的教學工具及輔助,當然大方向來講,希望成功建立這個技術以後,能夠應用在其他各個部會的面向。 |
44 |
張委員雅琳:好,這個部分的話,我們就來看看之後我們怎麼跟教育部討論,好不好?就未來的部分。 |
45 |
我覺得這件事情真的非常重要,因為從這幾張圖表,我們可以看到我們臺灣人的母語能力是迅速地流失,所以為什麼我會一直不停地強調我們的母語ChatGPT可不可以有更多的語言來支持,不管是學校裡的教學也好,或者是有沒有可能在生活裡面也可以來協助,像我自己33歲開始學臺語,如果當時有這個東西,其實對我來說也是非常有幫助,所以我想要知道目前TAIDE的GPT目標是希望可以提升它的等級到什麼樣子的等級,剛剛是說國小中高年級生的對話能力,我們有沒有可能把它提升到可以做臺語師資的能力呢? |
46 |
林副主任委員敏聰:這個要仔細評估,這個是一個很大的方向…… |
47 |
張委員雅琳:這可不可以做一些評估,好不好? |
48 |
林副主任委員敏聰:要做到這一點,可能要怎麼樣的資源及各方面,但是可以做基本的溝通本身應該是最基本的目標,這個也是目前我們大概的初步成果,有這個成果以後,我們應該是往下精進。 |
49 |
張委員雅琳:好,我也是拜託副主委幫我們想辦法,就是除了臺語可以有基本的對話能力,其他的國家語言也都要有,好不好? |
50 |
林副主任委員敏聰:是、是,好。 |
51 |
張委員雅琳:好不好?大概是什麼時候可以做到,我們就會後討論,好不好? |
52 |
再來,精準運科的部分,其實在107年的時候,我們有一個精準運動科學的研究專案計畫,當時就是奧運結束不久,大家都非常關注這件事情,當時國科會也編列了一個四年2.4億的研究計畫,所以讓我們現在在看棒球的時候,我們可以知道那個球現在投到哪一個位置,非常地有趣,也提供學校做智能羽球訓練,據我所知,這個訓練目前好像是已經結束了,也導入了商業化的使用,我現在收到的資訊是這樣,現在是商業化的使用,但是我希望運科不僅是要精準,還需要到普及,所以這樣子的計畫是不是可以落實到更多的基層訓練,讓更多的國中小青少年選手、運動員可以來做這樣子的科學訓練,這可不可行? |
53 |
林副主任委員敏聰:我想這個要透過跨部會的落地…… |
54 |
張委員雅琳:對。 |
55 |
林副主任委員敏聰:就核心的技術這邊發展出來,第一期的運科計畫已經出來,而且確實在某些關鍵的運動本身有幫助,所以如何…… |
56 |
張委員雅琳:沒錯,但是我們現在其實…… |
57 |
林副主任委員敏聰:可能我們和其他各個部會要一起來努力。 |
58 |
張委員雅琳:但是我們現在這十二個第二期計畫,像羽球,羽球的部分也是,還有像體操練習,因為體操其實是一個非常容易受到運動傷害的項目,這些東西是不是我們可以先找一些學校一起來做這些合作呢?就像新豐高中這樣子的案例,是不是可以找更多的中小學一起來合作呢? |
59 |
蘇處長碩斌:報告委員,因為二期運科的一個目的真的就是委員所講的,要從運動的專業訓練導向全民,其實我們這邊的科研都要用實驗的概念在進行,所以第一階段在科研的部分都是以特定的學校,取得默契之後,進行實驗,可行、安全之後,才會做推廣,所以推廣應該是下一期的工作,這個一定會做。 |
60 |
張委員雅琳:是第三期嗎?所以我們還會有第三期,你指的下一期是第三期就對了? |
61 |
蘇處長碩斌:我不能保證,但是我很期待有第三期。 |
62 |
張委員雅琳:對,這個部分我們是不是可以來思考規劃第三期?因為現在體育署的計畫雖然是有運科中心在做,可是效率實在是,目前來說每年1,000個,但我們現在總共已經有3萬5,000個體育班的學生,所以我還是非常希望我們可以跟體育署一起來討論,讓這個運科也要普及,讓更多的小孩可以去用比較安全而且比較科學化的訓練,不要在養成的過程之中就先受傷,這個部分我們是不是可以來跟體育署一起討論呢? |
63 |
蘇處長碩斌:這一定的,本來就是會跟體育署一起討論,也跟委員報告,因為我們在做實驗的階段裡面一定要保證其安全性,像羽球,羽球是用感測器來測量到底能不能有效地增進效率,所以在實驗階段裡面其實是特定學校,等到下一期之後就會…… |
64 |
張委員雅琳:所以現在這十二個案子都是已經找好特定學校了,是嗎? |
65 |
蘇處長碩斌:等到安全、商業化之後,其實就真的可以普及,因為一定要讓它成本降低,才有辦法普及。 |
66 |
張委員雅琳:對、對、對,我知道,抱歉,我再耽誤1分鐘的時間,就是我們現在這十二個案子裡面都已經找好學校了,是不是? |
67 |
蘇處長碩斌:對、對、對…… |
68 |
張委員雅琳:都已經找好了…… |
69 |
蘇處長碩斌:因為是大學老師在做實驗,所以他有特定的實驗室,以及到實驗室以外會有特定的學校。 |
70 |
張委員雅琳:這些學校都是什麼樣子?是…… |
71 |
蘇處長碩斌:大概都跟地緣有關係…… |
72 |
張委員雅琳:跟地緣有關係。 |
73 |
蘇處長碩斌:清大就會找新竹的學校,成大就會找臺南附近的學校。 |
74 |
張委員雅琳:好,那我希望各自詳細的學校,我們是不是可以知道它是屬於高中、國中,還是都是大學,因為這還是有差啦!基層訓練…… |
75 |
蘇處長碩斌:國中、高中居多。 |
76 |
張委員雅琳:國中、高中為主,是不是? |
77 |
蘇處長碩斌:如果是專業訓練員,那就是成人。 |
78 |
張委員雅琳:都是大學生? |
79 |
蘇處長碩斌:像拳擊,大概就不會有國小。 |
80 |
張委員雅琳:沒錯、沒錯,有一些項目,像體操,應該是比較小就要開始,所以我想知道相關的…… |
81 |
蘇處長碩斌:體操,對,但因為我們這邊是在做監測,所以體操主要是以師大的唐嘉鴻選手為實驗對象。 |
82 |
張委員雅琳:好,瞭解。因為剛才有提到商業化使用,但是我覺得商業化對一般小學、中學來說,其實可能不太具備這樣的資源跟資金去做,所以我們可能還是要思考如何提供公益使用的部分,好不好? |
83 |
蘇處長碩斌:其實那個…… |
84 |
張委員雅琳:還是目前已經有了? |
85 |
蘇處長碩斌:羽球是在做智慧球場,球場的建置完成之後,可以省掉非常多的教練成本,這個以後一定會往各個學校去推廣,他們會接受的。 |
86 |
張委員雅琳:目前我們已經有這樣的推廣計畫,還是還沒有? |
87 |
蘇處長碩斌:目前還沒建置完成,因為還要測試。 |
88 |
張委員雅琳:好,瞭解,謝謝。 |
89 |
主席:好,謝謝張雅琳委員,林副請回座。 |
90 |
現在休息5分鐘,謝謝。 |
91 |
休息(11時1分) |
92 |
繼續開會(11時6分) |
93 |
主席:好,現在繼續開會。 |
94 |
接下來請吳春城委員質詢。 |