iVOD / 151044

Field Value
IVOD_ID 151044
IVOD_URL https://ivod.ly.gov.tw/Play/Clip/1M/151044
日期 2024-04-11
會議資料.會議代碼 委員會-11-1-22-7
會議資料.會議代碼:str 第11屆第1會期教育及文化委員會第7次全體委員會議
會議資料.屆 11
會議資料.會期 1
會議資料.會次 7
會議資料.種類 委員會
會議資料.委員會代碼[0] 22
會議資料.委員會代碼:str[0] 教育及文化委員會
會議資料.標題 第11屆第1會期教育及文化委員會第7次全體委員會議
影片種類 Clip
開始時間 2024-04-11T10:49:28+08:00
結束時間 2024-04-11T11:00:55+08:00
影片長度 00:11:27
支援功能[0] ai-transcript
支援功能[1] gazette
video_url https://ivod-lyvod.cdn.hinet.net/vod_1/_definst_/mp4:1MClips/40ef09094e90200b9a79b55ec41bdc9c039536c142cb44fdf8ba9b0039caa7a6d3c8be10e344e7af5ea18f28b6918d91.mp4/playlist.m3u8
委員名稱 張雅琳
委員發言時間 10:49:28 - 11:00:55
會議時間 2024-04-11T09:00:00+08:00
會議名稱 立法院第11屆第1會期教育及文化委員會第7次全體委員會議(事由:邀請國家科學及技術委員會列席就「國家科技發展策略與布局」進行專題報告,並備質詢。(4月10日及11日二天一次會))
gazette.lineno 704
gazette.blocks[0][0] 張委員雅琳:(10時49分)謝謝主席,有請我們的副主委,謝謝。
gazette.blocks[1][0] 主席:好,有請林副主委。
gazette.blocks[2][0] 林副主任委員敏聰:委員早安。
gazette.blocks[3][0] 張委員雅琳:副主委早安。上次我們在討論TAIDE這個計畫的時候,是有講到我們現在正在開發所謂的學研版本,它有非常多不錯的功能,但是我也發現這個計畫中有一個很有趣的部分,也是我自己長期關注的所謂母語教育的部分。就是現在國科會是在建構正體中文的版本,同時也有在使用基於13B的學研版本來訓練臺語與客語的ChatGPT,希望未來可以應用在中小學的母語教育,來協助推廣母語教育。因為在訓練這種語言模型的時候,最重要的就是資料庫,我知道目前使用的資料庫就有台灣媠聲資料集,還有臺華台平行語料庫、客委會語音資料庫、客語能力認證資料庫,但是我看了我們公布在網站的訓練資料,幾乎都是正體中文的版本,這樣子的訓練資料量是足夠的嗎?
gazette.blocks[4][0] 林副主任委員敏聰:我想這個部分當然就是如同委員上面寫的,客語這個部分當然有特殊的資料庫,我們會積極去爭取,目前我們是儘量把已經可以授權的資料庫先放進去,而且TAIDE本身的資料庫很重要,它就是希望建立正體字本身,就繁體字本身這個資料庫,因為所有資料庫的背後都有社會文化的關係,所以這個是我們建立TAIDE非常重要的一個部分,具體來講夠不夠,請副執行秘書簡單回答。
gazette.blocks[5][0] 林副執行秘書明仁:跟委員報告,我想您說的沒錯,資料的訓練其實資料量就是最重要的,我們第一步開始當然是先充正體中文,包含臺語、客語、原住民母語的部分也都有在思考,可是的確那個語料從哪裡來,比如我們就會找客委會,問他們是不是有一些語言認證,那個就是,就會拉進來……
gazette.blocks[6][0] 張委員雅琳:我們未來還會有更多的訓練資料庫嗎?因為像文化部這幾年也產出非常多相關的……
gazette.blocks[7][0] 林副執行秘書明仁:會、會。
gazette.blocks[8][0] 張委員雅琳:客委會、原委會都有相關的一些教材,這些東西是不是都可以儘快地納進來,一起來做……
gazette.blocks[9][0] 林副執行秘書明仁:是,這個團隊都有很努力在跟各部會就資料協商,但它背後有著作權的問題需要解決。
gazette.blocks[10][0] 張委員雅琳:對,針對這件事情,你們有一個期程的規劃嗎?
gazette.blocks[11][0] 林副執行秘書明仁:我們第一期是4月底7B會先釋出,那案子就……
gazette.blocks[12][0] 張委員雅琳:我知道,但是我是針對於母語訓練的部分。
gazette.blocks[13][0] 林副執行秘書明仁:如果有新的案子的話,我們就會再繼續找母語,繼續再加強這方面的訓練。
gazette.blocks[14][0] 張委員雅琳:新的案子指的意思是什麼?是我們現在還沒有規劃,是未來再規劃的意思嗎?
gazette.blocks[15][0] 林副執行秘書明仁:有規劃了。
gazette.blocks[16][0] 張委員雅琳:有規劃。
gazette.blocks[17][0] 林副主任委員敏聰:這個會持續。
gazette.blocks[18][0] 林副執行秘書明仁:這個一定會持續。
gazette.blocks[19][0] 張委員雅琳:這個會持續,好,那有沒有一些相關的資料,就如果你現在已經有些規劃期程的話,是不是也可以提供到我們辦公室,好不好?
gazette.blocks[20][0] 林副執行秘書明仁:好,沒有問題。
gazette.blocks[21][0] 張委員雅琳:謝謝。
gazette.blocks[21][1] 再來,在這個訓練的資料裡面,像是國科會「科技大觀園」網站的資料,我是可以用臺語詢問ChatGPT關於科學的知識,會獲得臺語的回答嗎?
gazette.blocks[22][0] 林副主任委員敏聰:我們希望有一天可以用不同的語言來回答,但目前可能還沒有,這是一個很好的提議……
gazette.blocks[23][0] 張委員雅琳:那我們可不可以往這個方向,好不好?
gazette.blocks[24][0] 林副主任委員敏聰:對、對、對……
gazette.blocks[25][0] 張委員雅琳:不然,你已經做了這個……
gazette.blocks[26][0] 林副主任委員敏聰:就真的用不同語言輸入,然後它就可以回答,這個應該是要。
gazette.blocks[27][0] 張委員雅琳:好不好?我們往這個方向,因為你也都把一些語言認證的東西放進去了,我們往這個方向來努力……
gazette.blocks[28][0] 林副主任委員敏聰:對,這樣會很有感。
gazette.blocks[29][0] 張委員雅琳:對。再來,之前也有講到臺語版正在導入中小學臺語教學的應用案例,在臺南大學就有將臺語的這個模型出版,導入臺語對話的生成式AI,在仁德國小做臺語教學,我想要知道,目前是希望可以把這個機器人的對話能力提升到國小中高年級,來幫助學生學臺語,那我們現在相關的像客語或其他國家語言也是有這個方向,讓它可以成為幫助學生學臺語的嗎?這個也是有嗎?
gazette.blocks[30][0] 林副執行秘書明仁:這個後面我們就持續規劃。
gazette.blocks[31][0] 張委員雅琳:這個也是有一些相關的規劃期程已經出來了嗎?
gazette.blocks[32][0] 林副執行秘書明仁:目前還沒有。
gazette.blocks[33][0] 張委員雅琳:目前還沒有。
gazette.blocks[34][0] 林副主任委員敏聰:目前還沒有,我想有很多的應用,如果把這個平台建立起來,這個能力建立起來,因為我們是建立核心的引擎,輸入重要的資料,如果這個起來以後……
gazette.blocks[35][0] 張委員雅琳:我懂,但是因為13B已經開始做這個部分了嘛!
gazette.blocks[36][0] 林副主任委員敏聰:對,我們就可以跟其他的應用面連結,它就可以應用這個資料庫來做剛剛委員提供的這些很多很多的應用面。
gazette.blocks[37][0] 張委員雅琳:好,我想問一下,這台AI機器人有沒有辦法導入更多學校?
gazette.blocks[38][0] 林副主任委員敏聰:這台機器人……
gazette.blocks[39][0] 張委員雅琳:因為目前只有一個學校,未來有可能……
gazette.blocks[40][0] 林副主任委員敏聰:我覺得這是一個方向,如果未來……
gazette.blocks[41][0] 張委員雅琳:對,因為我們既然講要母語教學,只有一台,太少了吧!
gazette.blocks[42][0] 林副主任委員敏聰:也可以透過網站,就有很多東西是透過網站或者其他部分,因為這個牽扯到AI的硬體,進入學校,這個還要跟教育部什麼之類的要連結,看能不能把這個技術引進到他們常規性的教學工具及輔助,當然大方向來講,希望成功建立這個技術以後,能夠應用在其他各個部會的面向。
gazette.blocks[43][0] 張委員雅琳:好,這個部分的話,我們就來看看之後我們怎麼跟教育部討論,好不好?就未來的部分。
gazette.blocks[43][1] 我覺得這件事情真的非常重要,因為從這幾張圖表,我們可以看到我們臺灣人的母語能力是迅速地流失,所以為什麼我會一直不停地強調我們的母語ChatGPT可不可以有更多的語言來支持,不管是學校裡的教學也好,或者是有沒有可能在生活裡面也可以來協助,像我自己33歲開始學臺語,如果當時有這個東西,其實對我來說也是非常有幫助,所以我想要知道目前TAIDE的GPT目標是希望可以提升它的等級到什麼樣子的等級,剛剛是說國小中高年級生的對話能力,我們有沒有可能把它提升到可以做臺語師資的能力呢?
gazette.blocks[44][0] 林副主任委員敏聰:這個要仔細評估,這個是一個很大的方向……
gazette.blocks[45][0] 張委員雅琳:這可不可以做一些評估,好不好?
gazette.blocks[46][0] 林副主任委員敏聰:要做到這一點,可能要怎麼樣的資源及各方面,但是可以做基本的溝通本身應該是最基本的目標,這個也是目前我們大概的初步成果,有這個成果以後,我們應該是往下精進。
gazette.blocks[47][0] 張委員雅琳:好,我也是拜託副主委幫我們想辦法,就是除了臺語可以有基本的對話能力,其他的國家語言也都要有,好不好?
gazette.blocks[48][0] 林副主任委員敏聰:是、是,好。
gazette.blocks[49][0] 張委員雅琳:好不好?大概是什麼時候可以做到,我們就會後討論,好不好?
gazette.blocks[49][1] 再來,精準運科的部分,其實在107年的時候,我們有一個精準運動科學的研究專案計畫,當時就是奧運結束不久,大家都非常關注這件事情,當時國科會也編列了一個四年2.4億的研究計畫,所以讓我們現在在看棒球的時候,我們可以知道那個球現在投到哪一個位置,非常地有趣,也提供學校做智能羽球訓練,據我所知,這個訓練目前好像是已經結束了,也導入了商業化的使用,我現在收到的資訊是這樣,現在是商業化的使用,但是我希望運科不僅是要精準,還需要到普及,所以這樣子的計畫是不是可以落實到更多的基層訓練,讓更多的國中小青少年選手、運動員可以來做這樣子的科學訓練,這可不可行?
gazette.blocks[50][0] 林副主任委員敏聰:我想這個要透過跨部會的落地……
gazette.blocks[51][0] 張委員雅琳:對。
gazette.blocks[52][0] 林副主任委員敏聰:就核心的技術這邊發展出來,第一期的運科計畫已經出來,而且確實在某些關鍵的運動本身有幫助,所以如何……
gazette.blocks[53][0] 張委員雅琳:沒錯,但是我們現在其實……
gazette.blocks[54][0] 林副主任委員敏聰:可能我們和其他各個部會要一起來努力。
gazette.blocks[55][0] 張委員雅琳:但是我們現在這十二個第二期計畫,像羽球,羽球的部分也是,還有像體操練習,因為體操其實是一個非常容易受到運動傷害的項目,這些東西是不是我們可以先找一些學校一起來做這些合作呢?就像新豐高中這樣子的案例,是不是可以找更多的中小學一起來合作呢?
gazette.blocks[56][0] 蘇處長碩斌:報告委員,因為二期運科的一個目的真的就是委員所講的,要從運動的專業訓練導向全民,其實我們這邊的科研都要用實驗的概念在進行,所以第一階段在科研的部分都是以特定的學校,取得默契之後,進行實驗,可行、安全之後,才會做推廣,所以推廣應該是下一期的工作,這個一定會做。
gazette.blocks[57][0] 張委員雅琳:是第三期嗎?所以我們還會有第三期,你指的下一期是第三期就對了?
gazette.blocks[58][0] 蘇處長碩斌:我不能保證,但是我很期待有第三期。
gazette.blocks[59][0] 張委員雅琳:對,這個部分我們是不是可以來思考規劃第三期?因為現在體育署的計畫雖然是有運科中心在做,可是效率實在是,目前來說每年1,000個,但我們現在總共已經有3萬5,000個體育班的學生,所以我還是非常希望我們可以跟體育署一起來討論,讓這個運科也要普及,讓更多的小孩可以去用比較安全而且比較科學化的訓練,不要在養成的過程之中就先受傷,這個部分我們是不是可以來跟體育署一起討論呢?
gazette.blocks[60][0] 蘇處長碩斌:這一定的,本來就是會跟體育署一起討論,也跟委員報告,因為我們在做實驗的階段裡面一定要保證其安全性,像羽球,羽球是用感測器來測量到底能不能有效地增進效率,所以在實驗階段裡面其實是特定學校,等到下一期之後就會……
gazette.blocks[61][0] 張委員雅琳:所以現在這十二個案子都是已經找好特定學校了,是嗎?
gazette.blocks[62][0] 蘇處長碩斌:等到安全、商業化之後,其實就真的可以普及,因為一定要讓它成本降低,才有辦法普及。
gazette.blocks[63][0] 張委員雅琳:對、對、對,我知道,抱歉,我再耽誤1分鐘的時間,就是我們現在這十二個案子裡面都已經找好學校了,是不是?
gazette.blocks[64][0] 蘇處長碩斌:對、對、對……
gazette.blocks[65][0] 張委員雅琳:都已經找好了……
gazette.blocks[66][0] 蘇處長碩斌:因為是大學老師在做實驗,所以他有特定的實驗室,以及到實驗室以外會有特定的學校。
gazette.blocks[67][0] 張委員雅琳:這些學校都是什麼樣子?是……
gazette.blocks[68][0] 蘇處長碩斌:大概都跟地緣有關係……
gazette.blocks[69][0] 張委員雅琳:跟地緣有關係。
gazette.blocks[70][0] 蘇處長碩斌:清大就會找新竹的學校,成大就會找臺南附近的學校。
gazette.blocks[71][0] 張委員雅琳:好,那我希望各自詳細的學校,我們是不是可以知道它是屬於高中、國中,還是都是大學,因為這還是有差啦!基層訓練……
gazette.blocks[72][0] 蘇處長碩斌:國中、高中居多。
gazette.blocks[73][0] 張委員雅琳:國中、高中為主,是不是?
gazette.blocks[74][0] 蘇處長碩斌:如果是專業訓練員,那就是成人。
gazette.blocks[75][0] 張委員雅琳:都是大學生?
gazette.blocks[76][0] 蘇處長碩斌:像拳擊,大概就不會有國小。
gazette.blocks[77][0] 張委員雅琳:沒錯、沒錯,有一些項目,像體操,應該是比較小就要開始,所以我想知道相關的……
gazette.blocks[78][0] 蘇處長碩斌:體操,對,但因為我們這邊是在做監測,所以體操主要是以師大的唐嘉鴻選手為實驗對象。
gazette.blocks[79][0] 張委員雅琳:好,瞭解。因為剛才有提到商業化使用,但是我覺得商業化對一般小學、中學來說,其實可能不太具備這樣的資源跟資金去做,所以我們可能還是要思考如何提供公益使用的部分,好不好?
gazette.blocks[80][0] 蘇處長碩斌:其實那個……
gazette.blocks[81][0] 張委員雅琳:還是目前已經有了?
gazette.blocks[82][0] 蘇處長碩斌:羽球是在做智慧球場,球場的建置完成之後,可以省掉非常多的教練成本,這個以後一定會往各個學校去推廣,他們會接受的。
gazette.blocks[83][0] 張委員雅琳:目前我們已經有這樣的推廣計畫,還是還沒有?
gazette.blocks[84][0] 蘇處長碩斌:目前還沒建置完成,因為還要測試。
gazette.blocks[85][0] 張委員雅琳:好,瞭解,謝謝。
gazette.blocks[86][0] 主席:好,謝謝張雅琳委員,林副請回座。
gazette.blocks[86][1] 現在休息5分鐘,謝謝。
gazette.blocks[86][2] 休息(11時1分)
gazette.blocks[86][3] 繼續開會(11時6分)
gazette.blocks[87][0] 主席:好,現在繼續開會。
gazette.blocks[87][1] 接下來請吳春城委員質詢。
gazette.agenda.page_end 386
gazette.agenda.meet_id 委員會-11-1-22-7
gazette.agenda.speakers[0] 林宜瑾
gazette.agenda.speakers[1] 洪孟楷
gazette.agenda.speakers[2] 柯志恩
gazette.agenda.speakers[3] 吳沛憶
gazette.agenda.speakers[4] 羅廷瑋
gazette.agenda.speakers[5] 陳培瑜
gazette.agenda.speakers[6] 葛如鈞
gazette.agenda.speakers[7] 郭昱晴
gazette.agenda.speakers[8] 葉元之
gazette.agenda.speakers[9] 陳秀寳
gazette.agenda.speakers[10] 張雅琳
gazette.agenda.speakers[11] 吳春城
gazette.agenda.speakers[12] 萬美玲
gazette.agenda.speakers[13] 范雲
gazette.agenda.speakers[14] 鄭天財Sra Kacaw
gazette.agenda.speakers[15] 牛煦庭
gazette.agenda.speakers[16] 鍾佳濱
gazette.agenda.speakers[17] 楊瓊瓔
gazette.agenda.speakers[18] 林倩綺
gazette.agenda.speakers[19] 陳冠廷
gazette.agenda.speakers[20] 邱志偉
gazette.agenda.page_start 321
gazette.agenda.meetingDate[0] 2024-04-11
gazette.agenda.gazette_id 1132701
gazette.agenda.agenda_lcidc_ids[0] 1132701_00006
gazette.agenda.meet_name 立法院第11屆第1會期教育及文化委員會第7次全體委員會議紀錄
gazette.agenda.content 邀請國家科學及技術委員會列席就「國家科技發展策略與布局」進行專題報告,並備質詢
gazette.agenda.agenda_id 1132701_00005
transcript.pyannote[0].speaker SPEAKER_00
transcript.pyannote[0].start 0.03096875
transcript.pyannote[0].end 1.71846875
transcript.pyannote[1].speaker SPEAKER_01
transcript.pyannote[1].start 1.19534375
transcript.pyannote[1].end 1.66784375
transcript.pyannote[2].speaker SPEAKER_00
transcript.pyannote[2].start 9.95346875
transcript.pyannote[2].end 14.57721875
transcript.pyannote[3].speaker SPEAKER_02
transcript.pyannote[3].start 10.25721875
transcript.pyannote[3].end 10.27409375
transcript.pyannote[4].speaker SPEAKER_01
transcript.pyannote[4].start 10.27409375
transcript.pyannote[4].end 10.45971875
transcript.pyannote[5].speaker SPEAKER_02
transcript.pyannote[5].start 18.17159375
transcript.pyannote[5].end 18.72846875
transcript.pyannote[6].speaker SPEAKER_00
transcript.pyannote[6].start 20.33159375
transcript.pyannote[6].end 61.16909375
transcript.pyannote[7].speaker SPEAKER_00
transcript.pyannote[7].start 61.89471875
transcript.pyannote[7].end 81.11534375
transcript.pyannote[8].speaker SPEAKER_02
transcript.pyannote[8].start 81.85784375
transcript.pyannote[8].end 102.15846875
transcript.pyannote[9].speaker SPEAKER_00
transcript.pyannote[9].start 88.91159375
transcript.pyannote[9].end 89.14784375
transcript.pyannote[10].speaker SPEAKER_02
transcript.pyannote[10].start 102.41159375
transcript.pyannote[10].end 114.12284375
transcript.pyannote[11].speaker SPEAKER_01
transcript.pyannote[11].start 114.71346875
transcript.pyannote[11].end 140.68409375
transcript.pyannote[12].speaker SPEAKER_02
transcript.pyannote[12].start 118.72971875
transcript.pyannote[12].end 119.11784375
transcript.pyannote[13].speaker SPEAKER_02
transcript.pyannote[13].start 120.72096875
transcript.pyannote[13].end 121.05846875
transcript.pyannote[14].speaker SPEAKER_00
transcript.pyannote[14].start 128.82096875
transcript.pyannote[14].end 129.22596875
transcript.pyannote[15].speaker SPEAKER_00
transcript.pyannote[15].start 133.47846875
transcript.pyannote[15].end 133.95096875
transcript.pyannote[16].speaker SPEAKER_00
transcript.pyannote[16].start 140.61659375
transcript.pyannote[16].end 146.16846875
transcript.pyannote[17].speaker SPEAKER_01
transcript.pyannote[17].start 146.16846875
transcript.pyannote[17].end 146.69159375
transcript.pyannote[18].speaker SPEAKER_00
transcript.pyannote[18].start 146.50596875
transcript.pyannote[18].end 153.50909375
transcript.pyannote[19].speaker SPEAKER_01
transcript.pyannote[19].start 152.47971875
transcript.pyannote[19].end 162.55409375
transcript.pyannote[20].speaker SPEAKER_00
transcript.pyannote[20].start 160.25909375
transcript.pyannote[20].end 160.63034375
transcript.pyannote[21].speaker SPEAKER_00
transcript.pyannote[21].start 161.15346875
transcript.pyannote[21].end 161.50784375
transcript.pyannote[22].speaker SPEAKER_01
transcript.pyannote[22].start 162.75659375
transcript.pyannote[22].end 162.77346875
transcript.pyannote[23].speaker SPEAKER_00
transcript.pyannote[23].start 162.77346875
transcript.pyannote[23].end 165.77721875
transcript.pyannote[24].speaker SPEAKER_01
transcript.pyannote[24].start 166.21596875
transcript.pyannote[24].end 174.90659375
transcript.pyannote[25].speaker SPEAKER_00
transcript.pyannote[25].start 166.51971875
transcript.pyannote[25].end 167.97096875
transcript.pyannote[26].speaker SPEAKER_00
transcript.pyannote[26].start 173.77596875
transcript.pyannote[26].end 176.79659375
transcript.pyannote[27].speaker SPEAKER_01
transcript.pyannote[27].start 176.74596875
transcript.pyannote[27].end 176.76284375
transcript.pyannote[28].speaker SPEAKER_01
transcript.pyannote[28].start 176.77971875
transcript.pyannote[28].end 181.85909375
transcript.pyannote[29].speaker SPEAKER_00
transcript.pyannote[29].start 181.57221875
transcript.pyannote[29].end 186.78659375
transcript.pyannote[30].speaker SPEAKER_01
transcript.pyannote[30].start 185.11596875
transcript.pyannote[30].end 189.19971875
transcript.pyannote[31].speaker SPEAKER_00
transcript.pyannote[31].start 187.84971875
transcript.pyannote[31].end 205.45034375
transcript.pyannote[32].speaker SPEAKER_01
transcript.pyannote[32].start 193.89096875
transcript.pyannote[32].end 194.59971875
transcript.pyannote[33].speaker SPEAKER_02
transcript.pyannote[33].start 205.77096875
transcript.pyannote[33].end 212.58846875
transcript.pyannote[34].speaker SPEAKER_00
transcript.pyannote[34].start 211.35659375
transcript.pyannote[34].end 214.95096875
transcript.pyannote[35].speaker SPEAKER_02
transcript.pyannote[35].start 213.31409375
transcript.pyannote[35].end 218.54534375
transcript.pyannote[36].speaker SPEAKER_00
transcript.pyannote[36].start 218.54534375
transcript.pyannote[36].end 223.50659375
transcript.pyannote[37].speaker SPEAKER_02
transcript.pyannote[37].start 222.30846875
transcript.pyannote[37].end 222.34221875
transcript.pyannote[38].speaker SPEAKER_02
transcript.pyannote[38].start 222.47721875
transcript.pyannote[38].end 224.62034375
transcript.pyannote[39].speaker SPEAKER_00
transcript.pyannote[39].start 224.43471875
transcript.pyannote[39].end 256.21034375
transcript.pyannote[40].speaker SPEAKER_02
transcript.pyannote[40].start 257.03721875
transcript.pyannote[40].end 261.39096875
transcript.pyannote[41].speaker SPEAKER_00
transcript.pyannote[41].start 259.85534375
transcript.pyannote[41].end 260.96909375
transcript.pyannote[42].speaker SPEAKER_00
transcript.pyannote[42].start 261.27284375
transcript.pyannote[42].end 265.57596875
transcript.pyannote[43].speaker SPEAKER_02
transcript.pyannote[43].start 265.30596875
transcript.pyannote[43].end 265.40721875
transcript.pyannote[44].speaker SPEAKER_00
transcript.pyannote[44].start 266.21721875
transcript.pyannote[44].end 266.79096875
transcript.pyannote[45].speaker SPEAKER_02
transcript.pyannote[45].start 266.79096875
transcript.pyannote[45].end 276.29159375
transcript.pyannote[46].speaker SPEAKER_00
transcript.pyannote[46].start 275.36346875
transcript.pyannote[46].end 278.48534375
transcript.pyannote[47].speaker SPEAKER_02
transcript.pyannote[47].start 277.59096875
transcript.pyannote[47].end 284.42534375
transcript.pyannote[48].speaker SPEAKER_00
transcript.pyannote[48].start 284.07096875
transcript.pyannote[48].end 287.73284375
transcript.pyannote[49].speaker SPEAKER_02
transcript.pyannote[49].start 288.71159375
transcript.pyannote[49].end 291.29346875
transcript.pyannote[50].speaker SPEAKER_00
transcript.pyannote[50].start 290.38221875
transcript.pyannote[50].end 292.62659375
transcript.pyannote[51].speaker SPEAKER_02
transcript.pyannote[51].start 291.52971875
transcript.pyannote[51].end 291.90096875
transcript.pyannote[52].speaker SPEAKER_02
transcript.pyannote[52].start 292.82909375
transcript.pyannote[52].end 298.48221875
transcript.pyannote[53].speaker SPEAKER_00
transcript.pyannote[53].start 297.70596875
transcript.pyannote[53].end 300.32159375
transcript.pyannote[54].speaker SPEAKER_00
transcript.pyannote[54].start 300.84471875
transcript.pyannote[54].end 301.63784375
transcript.pyannote[55].speaker SPEAKER_02
transcript.pyannote[55].start 302.61659375
transcript.pyannote[55].end 324.28409375
transcript.pyannote[56].speaker SPEAKER_00
transcript.pyannote[56].start 324.57096875
transcript.pyannote[56].end 365.12159375
transcript.pyannote[57].speaker SPEAKER_02
transcript.pyannote[57].start 324.79034375
transcript.pyannote[57].end 325.27971875
transcript.pyannote[58].speaker SPEAKER_00
transcript.pyannote[58].start 365.88096875
transcript.pyannote[58].end 380.93346875
transcript.pyannote[59].speaker SPEAKER_02
transcript.pyannote[59].start 382.08096875
transcript.pyannote[59].end 400.25534375
transcript.pyannote[60].speaker SPEAKER_00
transcript.pyannote[60].start 385.20284375
transcript.pyannote[60].end 386.80596875
transcript.pyannote[61].speaker SPEAKER_01
transcript.pyannote[61].start 386.80596875
transcript.pyannote[61].end 386.83971875
transcript.pyannote[62].speaker SPEAKER_00
transcript.pyannote[62].start 400.13721875
transcript.pyannote[62].end 408.67596875
transcript.pyannote[63].speaker SPEAKER_02
transcript.pyannote[63].start 400.47471875
transcript.pyannote[63].end 401.08221875
transcript.pyannote[64].speaker SPEAKER_02
transcript.pyannote[64].start 408.43971875
transcript.pyannote[64].end 408.54096875
transcript.pyannote[65].speaker SPEAKER_02
transcript.pyannote[65].start 408.67596875
transcript.pyannote[65].end 409.16534375
transcript.pyannote[66].speaker SPEAKER_00
transcript.pyannote[66].start 409.16534375
transcript.pyannote[66].end 469.00409375
transcript.pyannote[67].speaker SPEAKER_02
transcript.pyannote[67].start 470.18534375
transcript.pyannote[67].end 473.50971875
transcript.pyannote[68].speaker SPEAKER_00
transcript.pyannote[68].start 473.37471875
transcript.pyannote[68].end 473.49284375
transcript.pyannote[69].speaker SPEAKER_00
transcript.pyannote[69].start 473.50971875
transcript.pyannote[69].end 473.66159375
transcript.pyannote[70].speaker SPEAKER_02
transcript.pyannote[70].start 473.66159375
transcript.pyannote[70].end 487.38096875
transcript.pyannote[71].speaker SPEAKER_00
transcript.pyannote[71].start 481.98096875
transcript.pyannote[71].end 482.53784375
transcript.pyannote[72].speaker SPEAKER_00
transcript.pyannote[72].start 483.04409375
transcript.pyannote[72].end 484.27596875
transcript.pyannote[73].speaker SPEAKER_00
transcript.pyannote[73].start 486.94221875
transcript.pyannote[73].end 504.05346875
transcript.pyannote[74].speaker SPEAKER_00
transcript.pyannote[74].start 504.50909375
transcript.pyannote[74].end 510.88784375
transcript.pyannote[75].speaker SPEAKER_03
transcript.pyannote[75].start 505.75784375
transcript.pyannote[75].end 506.39909375
transcript.pyannote[76].speaker SPEAKER_03
transcript.pyannote[76].start 510.88784375
transcript.pyannote[76].end 532.28534375
transcript.pyannote[77].speaker SPEAKER_00
transcript.pyannote[77].start 532.43721875
transcript.pyannote[77].end 536.84159375
transcript.pyannote[78].speaker SPEAKER_03
transcript.pyannote[78].start 534.31034375
transcript.pyannote[78].end 535.35659375
transcript.pyannote[79].speaker SPEAKER_03
transcript.pyannote[79].start 536.48721875
transcript.pyannote[79].end 539.30534375
transcript.pyannote[80].speaker SPEAKER_00
transcript.pyannote[80].start 539.50784375
transcript.pyannote[80].end 572.54909375
transcript.pyannote[81].speaker SPEAKER_03
transcript.pyannote[81].start 569.42721875
transcript.pyannote[81].end 569.66346875
transcript.pyannote[82].speaker SPEAKER_03
transcript.pyannote[82].start 572.11034375
transcript.pyannote[82].end 591.24659375
transcript.pyannote[83].speaker SPEAKER_00
transcript.pyannote[83].start 585.37409375
transcript.pyannote[83].end 585.74534375
transcript.pyannote[84].speaker SPEAKER_00
transcript.pyannote[84].start 586.67346875
transcript.pyannote[84].end 587.04471875
transcript.pyannote[85].speaker SPEAKER_00
transcript.pyannote[85].start 590.20034375
transcript.pyannote[85].end 593.45721875
transcript.pyannote[86].speaker SPEAKER_03
transcript.pyannote[86].start 592.12409375
transcript.pyannote[86].end 597.18659375
transcript.pyannote[87].speaker SPEAKER_00
transcript.pyannote[87].start 597.01784375
transcript.pyannote[87].end 603.58221875
transcript.pyannote[88].speaker SPEAKER_03
transcript.pyannote[88].start 603.58221875
transcript.pyannote[88].end 613.26846875
transcript.pyannote[89].speaker SPEAKER_00
transcript.pyannote[89].start 604.37534375
transcript.pyannote[89].end 605.91096875
transcript.pyannote[90].speaker SPEAKER_00
transcript.pyannote[90].start 613.26846875
transcript.pyannote[90].end 614.48346875
transcript.pyannote[91].speaker SPEAKER_00
transcript.pyannote[91].start 615.14159375
transcript.pyannote[91].end 616.52534375
transcript.pyannote[92].speaker SPEAKER_03
transcript.pyannote[92].start 615.20909375
transcript.pyannote[92].end 623.07284375
transcript.pyannote[93].speaker SPEAKER_00
transcript.pyannote[93].start 618.28034375
transcript.pyannote[93].end 619.19159375
transcript.pyannote[94].speaker SPEAKER_00
transcript.pyannote[94].start 623.07284375
transcript.pyannote[94].end 629.67096875
transcript.pyannote[95].speaker SPEAKER_03
transcript.pyannote[95].start 628.62471875
transcript.pyannote[95].end 633.72096875
transcript.pyannote[96].speaker SPEAKER_00
transcript.pyannote[96].start 630.04221875
transcript.pyannote[96].end 631.18971875
transcript.pyannote[97].speaker SPEAKER_00
transcript.pyannote[97].start 633.82221875
transcript.pyannote[97].end 635.29034375
transcript.pyannote[98].speaker SPEAKER_03
transcript.pyannote[98].start 635.02034375
transcript.pyannote[98].end 638.05784375
transcript.pyannote[99].speaker SPEAKER_00
transcript.pyannote[99].start 637.04534375
transcript.pyannote[99].end 642.37784375
transcript.pyannote[100].speaker SPEAKER_00
transcript.pyannote[100].start 642.44534375
transcript.pyannote[100].end 643.72784375
transcript.pyannote[101].speaker SPEAKER_03
transcript.pyannote[101].start 642.58034375
transcript.pyannote[101].end 652.01346875
transcript.pyannote[102].speaker SPEAKER_00
transcript.pyannote[102].start 649.81971875
transcript.pyannote[102].end 651.50721875
transcript.pyannote[103].speaker SPEAKER_00
transcript.pyannote[103].start 652.19909375
transcript.pyannote[103].end 667.42034375
transcript.pyannote[104].speaker SPEAKER_03
transcript.pyannote[104].start 667.97721875
transcript.pyannote[104].end 679.68846875
transcript.pyannote[105].speaker SPEAKER_00
transcript.pyannote[105].start 668.17971875
transcript.pyannote[105].end 668.36534375
transcript.pyannote[106].speaker SPEAKER_00
transcript.pyannote[106].start 669.34409375
transcript.pyannote[106].end 670.64346875
transcript.pyannote[107].speaker SPEAKER_00
transcript.pyannote[107].start 672.21284375
transcript.pyannote[107].end 672.82034375
transcript.pyannote[108].speaker SPEAKER_00
transcript.pyannote[108].start 676.31346875
transcript.pyannote[108].end 676.58346875
transcript.pyannote[109].speaker SPEAKER_00
transcript.pyannote[109].start 679.68846875
transcript.pyannote[109].end 682.03409375
transcript.pyannote[110].speaker SPEAKER_03
transcript.pyannote[110].start 682.03409375
transcript.pyannote[110].end 684.51471875
transcript.pyannote[111].speaker SPEAKER_00
transcript.pyannote[111].start 683.06346875
transcript.pyannote[111].end 685.64534375
transcript.pyannote[112].speaker SPEAKER_00
transcript.pyannote[112].start 686.59034375
transcript.pyannote[112].end 688.17659375
transcript.whisperx[0].start 0.109
transcript.whisperx[0].end 0.469
transcript.whisperx[0].text 委員長安
transcript.whisperx[1].start 20.673
transcript.whisperx[1].end 41.412
transcript.whisperx[1].text 副主委早安那就是上次我們在討論那個台達這個計畫的時候啊是有講到說我們現在正在開發這個所謂的學研版本啊然後它有非常多的不錯的一些功能哦那但是我也發現這個計畫中有一個很有趣的部分也是我自己長期關注的所謂的母語教育的部分好那就是說現在國科會是在建構中
transcript.whisperx[2].start 42.153
transcript.whisperx[2].end 42.693
transcript.whisperx[2].text 主席主席
transcript.whisperx[3].start 61.946
transcript.whisperx[3].end 80.321
transcript.whisperx[3].text 我知道目前使用的資料庫就有臺灣隨俠資料集還有臺華臺平行語料庫、客委會語音資料庫、客語能力認證資料庫但是我看就是說我們公布在網站訓練資料幾乎都是整體中文的版本那這樣子的訓練資料量是足夠的嗎?
transcript.whisperx[4].start 82.132
transcript.whisperx[4].end 109.586
transcript.whisperx[4].text 我想這部分當然就是如同委員這個上面寫的這個課與這個部分當然有特殊的這個資料庫我們要繼續爭取那目前我們盡量把已經我們可以授權的部分這個資料庫先放進去而且台德本身的他的這個資料庫很重要他就是希望建立政體本身就反理制本身在這個資料庫本身因為所有的資料庫背後都有社會文化的這個關係嘛所以這個是我們建立台德的部分非常重要的一個部分
transcript.whisperx[5].start 110.486
transcript.whisperx[5].end 111.189
transcript.whisperx[5].text 具體來講夠不夠是不是可以簡單回答
transcript.whisperx[6].start 115.001
transcript.whisperx[6].end 139.559
transcript.whisperx[6].text 跟委員報告我想您說的沒錯資料的訓練其實資料量就是最重要的那我們第一步開始當然是先衝正體中文那包含那個台語、客語以及這個原住民母語的部分也有都在思考可是的確那個語料從哪裡來像比如說我們就會找課委會說或是你們是不是有一些那個語言認證那個就是那就會拉進來
transcript.whisperx[7].start 140.68
transcript.whisperx[7].end 164.84
transcript.whisperx[7].text 那我們未來還會有更多的訓練資料庫嗎?因為像文化部這幾年也產出了非常多的相關的課委會、委員會都有相關的一些教材那這些東西是不是都可以盡快的把它納進來?這個團隊都有很努力在跟各部會的資料的協商但它背後有一些智慧財產、著作權的問題需要解決那這個大概預計是有沒有一個行程的規劃嗎?
transcript.whisperx[8].start 166.56
transcript.whisperx[8].end 170.321
transcript.whisperx[8].text 新的案子是什麼?是我們現在還沒有規劃?是未來在規劃的意思嗎?有規劃
transcript.whisperx[9].start 188.005
transcript.whisperx[9].end 191.107
transcript.whisperx[9].text 國科會科技大官員網站資料,我是可以用台語詢問GPT關於科學的知識,然後會獲得台語的回答嗎?
transcript.whisperx[10].start 205.759
transcript.whisperx[10].end 224.821
transcript.whisperx[10].text 對﹖
transcript.whisperx[11].start 225.061
transcript.whisperx[11].end 228.946
transcript.whisperx[11].text 在台南大學就有將台語的模型出版導入了這個台語對話的生成師AI在人的國小做台語教學
transcript.whisperx[12].start 242.283
transcript.whisperx[12].end 255.904
transcript.whisperx[12].text 目前是希望把機器人的對話能力提升到國中、中高中來幫助學生學台語我們現在相關的像客語或其他國家語言也是有這個方向讓他可以成為來幫助學生學台語的嗎?
transcript.whisperx[13].start 260.124
transcript.whisperx[13].end 273.173
transcript.whisperx[13].text 這也是有一些相關期程已經出來了嗎?目前還沒有我想有很多的應用如果說把這個平台建立起來這個能力建立起來因為我們是建立核心的引擎那輸入
transcript.whisperx[14].start 274.033
transcript.whisperx[14].end 275.914
transcript.whisperx[14].text 對,因為我們之前要講母語教學,只有一台,太少了吧?
transcript.whisperx[15].start 303.214
transcript.whisperx[15].end 323.968
transcript.whisperx[15].text 網站上也可以透過,因為這個牽扯到AI的硬體進入學校還要跟教育部連結能不能把這個技術引進到他們常規性的教學工具跟輔助這個當然是一個大方向來講是希望成功建立這個技術以後能夠應用在其他各個部會的面向
transcript.whisperx[16].start 324.949
transcript.whisperx[16].end 341.831
transcript.whisperx[16].text 好,那這個部分的話我們就來看看之後我們怎麼跟教育部討論好不好,就未來的部分啦。那就是說,因為我覺得這件事情真的非常重要,因為從這幾張圖表我們可以看到就是我們人,台灣的這個母語,台灣人的母語的能力是迅速的流失。
transcript.whisperx[17].start 342.752
transcript.whisperx[17].end 364.893
transcript.whisperx[17].text 所以為什麼我會一直不停地強調我們的母語CHAT GPT可不可以有更多的語言來去支持不管是學校裡在教學也好或者是說有沒有可能在生活裡面也可以來協助因為像我自己33歲開始學台語嘛如果當時有這東西其實對我來說也是非常有幫助啦所以我想要知道就是說我們目前啊這個的CHAT GPT這個台德的GPT抱歉
transcript.whisperx[18].start 365.914
transcript.whisperx[18].end 380.667
transcript.whisperx[18].text 我們目標是希望可以提升到他的等級到什麼樣子的等級因為剛是說中高級的國小師資的能力國小中高年級生的對話能力我們有沒有可能把它提升到可以做台語師資的能力呢
transcript.whisperx[19].start 383.414
transcript.whisperx[19].end 397.19
transcript.whisperx[19].text 這個要仔細評估這個都是一個很大的方向但是要做到這一點可能怎麼樣的資源跟各方面但是可以做基本的這些溝通本身應該是最基本的目標啦因為這個也是目前我們已經大概初步的成果那有這個成果以後我們應該是往下進進
transcript.whisperx[20].start 400.313
transcript.whisperx[20].end 400.553
transcript.whisperx[20].text 金準運科
transcript.whisperx[21].start 416.48
transcript.whisperx[21].end 439.222
transcript.whisperx[21].text 107年有一個精準運動科學的研究專案計畫因為當時奧運結束不久所以大家都非常關注這件事情那當時國科會也編列了一個4年的2.4億的研究計畫所以讓我們現在在看棒球的時候我們可以知道說那個球現在投到哪一個位置所以是非常的有趣然後也提供了學校做這個智能羽球訓練那據我所知
transcript.whisperx[22].start 440.823
transcript.whisperx[22].end 466.688
transcript.whisperx[22].text 這個訓練目前好像是已經結束了然後也導入了商業化的使用我現在收到的資訊是這樣現在是商業化的使用但是我希望運科不僅只是要精準還需要到普及所以這樣子的計畫是不是可以落實到更多的基層訓練讓更多的國中小的青少年選手運動員可以來做到這樣子的一個這樣子的科學訓練這可不可行
transcript.whisperx[23].start 470.482
transcript.whisperx[23].end 486.508
transcript.whisperx[23].text 我想跨部會這要透過跨部會的落地核心的技術這邊發展出來用這個第一期的運科計畫已經出來而且確實有幫助在某些關鍵的這個運動本身的這個幫忙所以如何變成可能要跟我們要其他各個部會要一起來
transcript.whisperx[24].start 487.549
transcript.whisperx[24].end 490.732
transcript.whisperx[24].text 在12個第二期的計畫,像是羽球、體操等,我們可以先找一些學校來一起做這些?
transcript.whisperx[25].start 504.639
transcript.whisperx[25].end 531.775
transcript.whisperx[25].text 合作呢?就像新豐高中這樣子的案例是不是可以找更多的中小學一起來合作呢?報告委員因為二期運課的一個目的真的就是委員所講的要從運動的專業訓練導向全民那其實我們這邊的科研都要用實驗的概念在進行所以第一階段在科研的部分都是以特定的學校然後取得默契之後進行實驗可行安全之後才會做推廣所以推廣應該是下一期的工作這個一定會做
transcript.whisperx[26].start 532.495
transcript.whisperx[26].end 555.475
transcript.whisperx[26].text 是第三期嗎?說明還會有第三期嗎?你指的下一期是第三期就對了?我不能保證,但是我很期待有第三期對,因為這個部分我們是不是可以來思考把它規劃第三期因為你現在那個體育署的計畫他們雖然是有這個運科中心在做可是這個效率實在是目前來說每年一千個我們總共現在已經有三萬五千個體育班的學生所以我還是非常希望說
transcript.whisperx[27].start 556.135
transcript.whisperx[27].end 571.633
transcript.whisperx[27].text 我們可以來跟體育署這邊一起來討論讓這個運動也要普及讓更多的小孩可以去用一個比較安全而且比較科學化的訓練不要在養成的過程之中就先受傷這部分我們是不是可以來跟體育署一起討論
transcript.whisperx[28].start 572.874
transcript.whisperx[28].end 596.993
transcript.whisperx[28].text 本來就是會跟體育署一起討論那也跟委員報告就是因為我們在做實驗的階段裡面一定要保證它的安全性所以像羽球羽球是用監測器來測量說它到底能不能有效的增進它的一個效率那所以呢在實驗階段裡面其實是特定學校那等到下一期之後就會等到安全商業化之後其實就真的可以普及因為一定要讓它成本降低才有辦法普及
transcript.whisperx[29].start 597.173
transcript.whisperx[29].end 599.856
transcript.whisperx[29].text 大學老師在做實驗所以他有特定的實驗室然後在以及到了實驗室以外會有特定的學校
transcript.whisperx[30].start 615.225
transcript.whisperx[30].end 615.625
transcript.whisperx[30].text 主持人 張雅琳
transcript.whisperx[31].start 633.857
transcript.whisperx[31].end 635.799
transcript.whisperx[31].text 提招主要是以次大的唐家宏選手做實驗對象
transcript.whisperx[32].start 652.279
transcript.whisperx[32].end 655.08
transcript.whisperx[32].text 商業化對於一般小學或中學來說是不具備資源或資金去做所以我們還是要去思考如何提供公益使用
transcript.whisperx[33].start 667.981
transcript.whisperx[33].end 668.081
transcript.whisperx[33].text 謝謝張雅琳