iVOD / 150097

陳秀寳 @ 第11屆第1會期教育及文化委員會第4次全體委員會議

Index	Text
0	陳委員秀寳：（10時13分）謝謝主席，請院長。
1	主席：院長。
2	廖院長俊智：陳委員早。
3	陳委員秀寳：院長早。院長，昨天在教文組的總質詢本席有針對短影音的部分提出質詢，院長應該有聽到昨天本席質詢短影音這個部分。這邊要來請教院長，過度不當的使用短影音對孩子的發展會有所影響，這個部分院長您同意嗎？
4	廖院長俊智：這部分我比較沒有研究，不過看起來有這個可能，但是我不是這方面的專家。
5	陳委員秀寳：你自己使用過短影音嗎？
6	廖院長俊智：大概偶爾看過，不是一天到晚使用。
7	陳委員秀寳：因為你也很忙，可能沒有很多時間，像這些孩子一樣，可能用了就成癮。今天再提一次關於短影音這個問題，因為本席昨天有提到，其實大部分的短影音是使用簡體的文字、簡體中文，現在最夯的短影音平台像是抖音或小紅書，這些短影音的強勢入侵，其實很嚴重的影響到大家對繁體中文的使用跟認知，不管是在國際間還是對我們的孩子都有很大的影響。另外一個狀況是，當現在我們正要發展我們AI語言模組的時候，我們需要大量的繁體中文資料讓AI來學習跟連結，其實繁體中文資料提供得越完整、越多，它所表達出來的訊息才會更清晰、更完整、更正確，但是現在遇到的狀況是，繁體中文資料量是比較少的，這種狀況幾乎可以算是內外夾攻，因為我們繁體中文資料庫的資料量偏少，加上如果我們的孩子已經被習慣使用簡體中文，院長，您覺得這樣對我們之後AI的語言模型發展會有什麼影響？
8	廖院長俊智：確實誠如委員提的，假如沒有很多繁體中文的資料來訓練新的大型語言模型的話，將來對我們文化的發展會產生非常大的負面影響，所以這方面中研院也在思考怎麼樣儘量開放我們所有繁中的資料，讓AI研究學者能夠一起來訓練我們AI的研究。關於這方面，李育杰要不要講一下？
9	李研究員育杰：剛剛委員的質詢事實上都是非常正確的，我們也用類似的說法成功的說服像公共電視、ETtoday無償釋出他們的繁體中文資料庫，這個也是我們對外的一個說法。
10	陳委員秀寳：是，其實這個部分跟之前中研院發生過會有錯誤的中國觀點、錯誤的語言模型也是有相關，中研院也有學者提到，臺灣需要自己的大型語言資料庫，院長，本席想要瞭解說，你們剛剛說你們會來協助，你們要如何協助整合我們繁中語言的資料庫？有怎樣比較具體的規劃嗎？
11	廖院長俊智：第一個，我們能夠開放的部分，目前沒有牽涉到任何智慧財產權或是copyright的部分，只要能夠開放的，我們會儘量立即、馬上開放。目前還有一些法規限制的部分，我們儘量能夠排除這些法規的限制，朝向把所有的資料都讓AI的大型語言模型訓練的這個方向走。
12	陳委員秀寳：是，院長講到一個重點，我們的資料如果能夠被釋出，能夠有越多的資料來提供，讓使用者的方便度越高，這樣子的訊息交流量越高的話，才能夠讓更多人使用得順手。就本席目前所知，國科會也有向中央社購買資料庫，中央社應該是目前提供繁中資料庫的首選，因為它的是非常非常的完整。再來，還要請教院長，未來除了對AI對話引擎要如何協助之外，我們要如何協助國科會來發展台版的ChatGPT？
13	廖院長俊智：我們跟國科會是攜手合作的，國科會的計畫大部分的成員都是我們院裡面的成員，所以我們不分彼此，事實上我們是同一個team、是同一個團隊在做的，所以國科會團隊大部分的人都是我們團隊的人……
14	陳委員秀寳：所以這邊會全力來協助整個AI的……
15	廖院長俊智：對，我們就是同一個團隊，不能講協助，我們就是同一個團隊。
16	陳委員秀寳：那就是一起努力。
17	廖院長俊智：對。
18	陳委員秀寳：講到AI的部分，我們再提一下，現在很多詐騙的手法，不管是AI圖片、AI假影片，都讓我們防不勝防，現在甚至有外媒來教導如何辨識AI假圖片，院長，你看一下這張圖片，這個部分有六個重點來教大家怎麼去辨識，包括放大仔細看、找到發圖來源等等，雖然他有教大家怎麼去判斷，但對於AI生成的假圖片，即使我們有這樣的程式去判斷它，還是會出錯，所以專家會建議還是不用為妙，因為有時候這個工具會把真實的圖片當作是假的，然後假的它又分辨不出哪一些是真的。可是如果民眾有這樣的疑慮，當人沒有辦法辨認的時候，我們有辦法藉助AI的技術來辨認AI生成的圖片或影片嗎？
19	廖院長俊智：我們請專家廖弘源所長來回答。
20	廖所長弘源：委員你好。這個題目其實10年前我在做數位典藏國家型計畫的時候，影像竄改術就是我在做的，那個時候的目的是為了修復一些在檔案局或是國家電影館裡面的影片，因為那些影片會長黴，因為是膠卷的，所以把它數位化以後，裡面會有黴在上面，所以我在2008年左右是專門在研發這個，然後我那時候的結論就是，如果我們沒有在取像的過程裡面就放浮水印的話，事實上這樣是很難偵測的，因為以我那時候的技術就可以弄得幾乎亂真，就是你沒有辦法判別的，甚至於可以把我這個現代人塞到古代黑白的影片裡面，然後你沒有辦法分辨在走路的那些人中，哪一個是現代人、哪一個是古代人。所以目前的 Deepfake所產生的這些東西，如果在成像的過程裡面沒有適當的放浮水印進去防偽的話，事實上是可以隨意篡改，而且以我的技術，你們是沒有辦法分辨的。
21	陳委員秀寳：所以這會變成一個很可怕的現象，就是我們無法分辨這個到底是真的還是假的，也沒有技術可以分辨，是這個意思嗎？
22	廖所長弘源：是的，這就是我前一陣子講的，Deepfake的技術救了所有做壞事的壞男人跟壞女人，因為我們沒有辦法驗證他們到底是不是真的，所以過去的那些做壞事的人都可以……
23	陳委員秀寳：所以以AI技術來合成的這些假影片、假圖片，我們沒有辦法用AI的技術反推回去說它是一個假的。
24	廖所長弘源：是的，沒有辦法，目前是沒有辦法的。
25	陳委員秀寳：當然我們對AI的期待是非常的高，也因為AI是我們很未知的，它未來的走向、會發展到怎樣的進展，到現在，譬如說剛才您的回答是，如果是用AI生成的假圖片、假影片，技術非常之高超的時候，即使是AI的技術都無法分辨，人也無法分辨，到那個時候真的會是一種不可控的局面。面對這樣的現象，不管是官司訴訟，不管是民眾的交易糾紛，不管是詐騙等等，我們都防不勝防，那民眾該如何自保？
26	廖所長弘源：這些事情就像在辦刑事案件一樣，因為在呈堂證供裡面，你如果拿出一個改變內容的東西的話，是不能當呈堂證供的，因為我長久以來也一直在幫刑事局處理犯罪的資料。
27	陳委員秀寳：但是我們要有辦法證明它是變造的。
28	廖所長弘源：沒有辦法證明，因為按照現在的技術，你真的沒有辦法證明合成的影像或video，是沒有辦法的。
29	陳委員秀寳：所以現在民眾只能希望各專家、各學者儘量的朝這個方向去精進、去研究，讓AI可以功能很強大，但是我們又可以信任。
30	廖所長弘源：未來可能有新的方法可以做這件事情，但是目前還沒看到。
31	陳委員秀寳：我應該代表我們的民眾們來要求、來拜託，期待我們儘快把這樣的技術發展出來。
32	廖所長弘源：這件事情是可遇不可求，因為全世界都期待目前有這樣的技術。
33	陳委員秀寳：好吧，那大家一起加油了！謝謝。
34	主席：好，謝謝。我們在第9號萬美玲委員質詢完畢之後，就休息5分鐘，謝謝。
35	現在請登記第8號郭昱晴委員。

公報詮釋資料

page_end	392
meet_id	委員會-11-1-22-4
speakers	["柯志恩","洪孟楷","羅廷瑋","吳沛憶","葛如鈞","林宜瑾","陳秀寳","郭昱晴","萬美玲","張雅琳","吳春城","陳培瑜","謝衣鳯","范雲","吳思瑤","葉元之","林倩綺"]
page_start	341
meetingDate	["2024-03-20"]
gazette_id	1131701
agenda_lcidc_ids	["1131701_00006"]
meet_name	立法院第11屆第1會期教育及文化委員會第4次全體委員會議紀錄
content	邀請中央研究院院長廖俊智列席報告業務概況，並備質詢
agenda_id	1131701_00005