iVOD / 160907

Field Value
IVOD_ID 160907
IVOD_URL https://ivod.ly.gov.tw/Play/Clip/1M/160907
日期 2025-05-01
會議資料.會議代碼 聯席會議-11-3-23,22-1
會議資料.會議代碼:str 第11屆第3會期交通、教育及文化委員會第1次聯席會議
會議資料.屆 11
會議資料.會期 3
會議資料.會次 1
會議資料.種類 聯席會議
會議資料.委員會代碼[0] 23
會議資料.委員會代碼[1] 22
會議資料.委員會代碼:str[0] 交通委員會
會議資料.委員會代碼:str[1] 教育及文化委員會
會議資料.標題 第11屆第3會期交通、教育及文化委員會第1次聯席會議
影片種類 Clip
開始時間 2025-05-01T12:12:15+08:00
結束時間 2025-05-01T12:19:38+08:00
影片長度 00:07:23
支援功能[0] ai-transcript
video_url https://ivod-lyvod.cdn.hinet.net/vod_1/_definst_/mp4:1MClips/872e8bbe37846fc08216e9afc0e827182bf9a8039e28b7cac64ac1618a5937c6fd113443f1ac9aa35ea18f28b6918d91.mp4/playlist.m3u8
委員名稱 陳培瑜
委員發言時間 12:12:15 - 12:19:38
會議時間 2025-05-01T09:00:00+08:00
會議名稱 立法院第11屆第3會期交通、教育及文化委員會第1次聯席會議(事由:一、審查委員林楚茵等17人擬具「新聞媒體與數位平台議價法草案」案。二、審查委員羅廷瑋等16人擬具「新聞媒體與數位平臺強制議價法草案」案。三、審查委員王鴻薇等20人擬具「新聞媒體與數位平臺強制議價法草案」案。四、審查台灣民眾黨黨團擬具「新聞媒體與數位科技平台公平發展法草案」案。五、審查委員林宜瑾等21人擬具「數位新聞發展與民主韌性法草案」案。六、審查委員范雲等21人擬具「數位新聞發展與民主韌性法草案」案。 【僅進行詢答】)
transcript.pyannote[0].speaker SPEAKER_01
transcript.pyannote[0].start 0.80721875
transcript.pyannote[0].end 9.29534375
transcript.pyannote[1].speaker SPEAKER_00
transcript.pyannote[1].start 7.18596875
transcript.pyannote[1].end 7.87784375
transcript.pyannote[2].speaker SPEAKER_00
transcript.pyannote[2].start 13.75034375
transcript.pyannote[2].end 14.23971875
transcript.pyannote[3].speaker SPEAKER_01
transcript.pyannote[3].start 14.23971875
transcript.pyannote[3].end 115.97909375
transcript.pyannote[4].speaker SPEAKER_00
transcript.pyannote[4].start 34.62471875
transcript.pyannote[4].end 34.91159375
transcript.pyannote[5].speaker SPEAKER_01
transcript.pyannote[5].start 116.87346875
transcript.pyannote[5].end 125.86784375
transcript.pyannote[6].speaker SPEAKER_01
transcript.pyannote[6].start 126.42471875
transcript.pyannote[6].end 173.53971875
transcript.pyannote[7].speaker SPEAKER_00
transcript.pyannote[7].start 161.71034375
transcript.pyannote[7].end 162.04784375
transcript.pyannote[8].speaker SPEAKER_00
transcript.pyannote[8].start 163.71846875
transcript.pyannote[8].end 163.73534375
transcript.pyannote[9].speaker SPEAKER_00
transcript.pyannote[9].start 174.02909375
transcript.pyannote[9].end 240.66846875
transcript.pyannote[10].speaker SPEAKER_01
transcript.pyannote[10].start 183.79971875
transcript.pyannote[10].end 184.59284375
transcript.pyannote[11].speaker SPEAKER_01
transcript.pyannote[11].start 216.21659375
transcript.pyannote[11].end 216.67221875
transcript.pyannote[12].speaker SPEAKER_01
transcript.pyannote[12].start 217.11096875
transcript.pyannote[12].end 217.92096875
transcript.pyannote[13].speaker SPEAKER_01
transcript.pyannote[13].start 233.61471875
transcript.pyannote[13].end 234.93096875
transcript.pyannote[14].speaker SPEAKER_01
transcript.pyannote[14].start 240.66846875
transcript.pyannote[14].end 244.19534375
transcript.pyannote[15].speaker SPEAKER_00
transcript.pyannote[15].start 240.70221875
transcript.pyannote[15].end 241.69784375
transcript.pyannote[16].speaker SPEAKER_01
transcript.pyannote[16].start 244.39784375
transcript.pyannote[16].end 274.26659375
transcript.pyannote[17].speaker SPEAKER_00
transcript.pyannote[17].start 270.11534375
transcript.pyannote[17].end 270.45284375
transcript.pyannote[18].speaker SPEAKER_01
transcript.pyannote[18].start 274.35096875
transcript.pyannote[18].end 294.02721875
transcript.pyannote[19].speaker SPEAKER_00
transcript.pyannote[19].start 291.22596875
transcript.pyannote[19].end 291.47909375
transcript.pyannote[20].speaker SPEAKER_00
transcript.pyannote[20].start 294.02721875
transcript.pyannote[20].end 294.29721875
transcript.pyannote[21].speaker SPEAKER_01
transcript.pyannote[21].start 294.29721875
transcript.pyannote[21].end 310.83471875
transcript.pyannote[22].speaker SPEAKER_01
transcript.pyannote[22].start 311.59409375
transcript.pyannote[22].end 321.88784375
transcript.pyannote[23].speaker SPEAKER_00
transcript.pyannote[23].start 322.03971875
transcript.pyannote[23].end 334.96596875
transcript.pyannote[24].speaker SPEAKER_01
transcript.pyannote[24].start 332.83971875
transcript.pyannote[24].end 336.18096875
transcript.pyannote[25].speaker SPEAKER_00
transcript.pyannote[25].start 335.69159375
transcript.pyannote[25].end 382.01346875
transcript.pyannote[26].speaker SPEAKER_01
transcript.pyannote[26].start 381.82784375
transcript.pyannote[26].end 426.93471875
transcript.pyannote[27].speaker SPEAKER_00
transcript.pyannote[27].start 384.30846875
transcript.pyannote[27].end 384.52784375
transcript.pyannote[28].speaker SPEAKER_00
transcript.pyannote[28].start 427.50846875
transcript.pyannote[28].end 430.42784375
transcript.pyannote[29].speaker SPEAKER_01
transcript.pyannote[29].start 430.42784375
transcript.pyannote[29].end 443.10096875
transcript.pyannote[30].speaker SPEAKER_00
transcript.pyannote[30].start 440.80596875
transcript.pyannote[30].end 441.61596875
transcript.pyannote[31].speaker SPEAKER_00
transcript.pyannote[31].start 442.61159375
transcript.pyannote[31].end 442.64534375
transcript.pyannote[32].speaker SPEAKER_01
transcript.pyannote[32].start 443.18534375
transcript.pyannote[32].end 443.97846875
transcript.whisperx[0].start 0.782
transcript.whisperx[0].end 7.416
transcript.whisperx[0].text 好 謝謝主席我可以直接請那個述發部的林次長嗎林次長好 謝謝
transcript.whisperx[1].start 14.52
transcript.whisperx[1].end 33.753
transcript.whisperx[1].text 市長午安 我其實從這個新聞溢價法媒體溢價法 我其實直接想跟你討論其實就是四個字叫做內容有價因為不管是在過去新聞媒體時代或者是現在所謂的大型語言模型就是所謂大家日常現在用的非常習慣的chat GPT其實這些語料模型背後都需要有意義的
transcript.whisperx[2].start 34.253
transcript.whisperx[2].end 57.161
transcript.whisperx[2].text 資料是那我們來看一下現在的狀態是這樣來下一張在台灣其實二零二五年的一月二十雜誌公會他們推內容有價侵權有罪這件事情而且有相關的訴訟正在進行我相信你是清楚的我就不再贅述其實不只新聞媒體的內容有價過去傳統出版產業的內容也是有價的那在訓練這些餘料模型上來往下看
transcript.whisperx[3].start 57.961
transcript.whisperx[3].end 79.697
transcript.whisperx[3].text 我們回到加拿大他們有這個負面的例子就是跟台灣一樣他們控告OpenAI在未經許可而且沒有付費的情況下盜取新聞機構數以百萬計受版權保護的文章於是呢這五個新聞機構就對OpenAI提起訴訟那目前訴訟正在進行中這個是比較負面的例子跟台灣一樣可是我們也看到正面的例子我們來看一下
transcript.whisperx[4].start 80.217
transcript.whisperx[4].end 105.87
transcript.whisperx[4].text Chubb GPT花錢跟很多英國媒體從衛報開始整個大型媒體集團開始用付費的方法授權使用這個資料尤其在Chubb GPT的Search版我們看到他們所用的都是這些我們認為非常精緻的語料資料餵給這個模型然後於是產出的內容就變得相對有意義那其實很多使用者也都大聲叫好但是我要說
transcript.whisperx[5].start 106.59
transcript.whisperx[5].end 125.157
transcript.whisperx[5].text 有訴訟的部分也有合理授權 合法授權 付錢的部分所以看起來這件事情此時此刻正在世界上發生好 下一張我看到速發部在3月3號有這個新聞稿我相信這應該是速發部主動提供的次長您在相關的媒體報導中 您說
transcript.whisperx[6].start 126.497
transcript.whisperx[6].end 148.17
transcript.whisperx[6].text 建立台湾主权AI训练的语料库松绑著作权法而且要免费提供训练语料给国内国外的大型语言模型让他们使用台湾的资料减少AI厂商跟内容拥有者的著作权纠纷我从一路讲到现在意思就是说我们台湾的书发布看起来
transcript.whisperx[7].start 148.61
transcript.whisperx[7].end 172.908
transcript.whisperx[7].text 知道世界的趨勢就是有訴訟的部分也有合法合理授權的部分看起來速發部現在在這件事情上想要採一個角色就是協助內容擁有者跟語料廠商AI廠商找到一個合作的可能性而不要去採進訴訟這件事情所以您剛剛說在這個新聞稿當說要免費提供訓練語料我想要說一下這個idea是怎麼來的
transcript.whisperx[8].start 174.64
transcript.whisperx[8].end 191.195
transcript.whisperx[8].text 因為我們在於說我們拿一些資料去訓練AI的model的時候到底這些AI model的廠商要不要付費來取得這些資料給這些內容擁有者這件事情本身是一個兩難一方面就是說那個內容的擁有者他覺得說我覺得要收錢
transcript.whisperx[9].start 192.196
transcript.whisperx[9].end 207.753
transcript.whisperx[9].text 可是對於這些大型的AI模型來講的話其實我也跟他們溝通過他們對於說使用台灣的資料來訓練他們的模型他們事實上是很有疑慮的事實上不是因為他們付不起錢而是他們擔心會侵權
transcript.whisperx[10].start 209.435
transcript.whisperx[10].end 232.441
transcript.whisperx[10].text 因為他們需要而且他們覺得說他要花很多的時間去跟台灣的內容擁有者去做那個談判他們擔心的是這個部分那結果造成的狀況呢是說像那個ChatterGPT或者是LAMA或者是這種外國的模型他在選擇那個中文語料庫的時候他們常常是拿中國的語料庫因為中國比較不注重
transcript.whisperx[11].start 232.981
transcript.whisperx[11].end 260.901
transcript.whisperx[11].text 那個知識財產權所以那個變得比較容易比較沒有法律風險那結果最後的結果是很不好的就是當我們用中文問問題的時候可能就會產出Garbage in garbage out的問題所以我先肯定書法部在這件事情上先踩住了一個立場就是要協助所謂的內容擁有者跟國內外的AI廠商但問題也就來了當你已經先喊出想辦法先找到免費授權
transcript.whisperx[12].start 261.821
transcript.whisperx[12].end 278.998
transcript.whisperx[12].text 或者是沒有著作權為優先各式各樣的語料資料我覺得這是很重要的一步但是我自己來自於所謂內容產業界我必須要說台灣的內容產業界不論是來下一張不論是好先直接跳下一張我要說台灣的
transcript.whisperx[13].start 279.839
transcript.whisperx[13].end 301.56
transcript.whisperx[13].text 生產內容的這些創作者不管是像楊雙子最近得了美國國家圖書獎或者是很棒的動畫廠商或者是我們在波羅納得大獎的插畫家這些都還只是我簡單的舉例這些有意義的而且高品質的素材其實可能才是下一步速發步你們的挑戰也就是我們剛開始先促成了這個合作的橋樑可是
transcript.whisperx[14].start 302.681
transcript.whisperx[14].end 320.413
transcript.whisperx[14].text 當餘料廠商這些AI廠商他們說我們想要更多很棒的資料協助我們產出有意義的內容的時候公司的發展是有價值的速發部未來要如何協助協同文化部協助這些內容擁有者真的可以找到一個合理的對談模式之餘對這些AI廠商
transcript.whisperx[15].start 322.543
transcript.whisperx[15].end 335.5
transcript.whisperx[15].text 首先在政策上面我們是主張就是說如果沒有經過正式的授權的話這些語言模型它不能隨便拿台灣的這些語調去當然這個非常非常重要免得遇到像加拿大那個訴訟一樣
transcript.whisperx[16].start 338.043
transcript.whisperx[16].end 354.459
transcript.whisperx[16].text 除了那些免費的我們提供免費的以外我們認為說高品質的語料其實應該是正式取得授權而且付費那我們就想辦法在法律上面我們跟文化部一起合作想辦法建立出一個規則然後一個計價的方法降低這個
transcript.whisperx[17].start 355.68
transcript.whisperx[17].end 381.849
transcript.whisperx[17].text 這個negotiation的那個成本這樣子的話不管是台灣或者是國外的這些那個大型元模型LLM他們就會更方便更快速的取得這些這些餘料就如同我們剛才所講的其實他們真正在乎的不是他付多少錢因為對他們來講這些錢不是很大的金額他們在乎的是這個那個協商的成本以及這個法律清錢的那個可能性
transcript.whisperx[18].start 382.049
transcript.whisperx[18].end 396.718
transcript.whisperx[18].text 還有就是跨國文化之間的不同啦我必須要這麼說你讓這些open air的廠商他到台灣來要找到這些內容擁有者直接對話其實是困難的但是我透過速發部跟文化部合作的平台真的在假以時日我們真的希望在台灣我們可以聽到很棒的case
transcript.whisperx[19].start 397.378
transcript.whisperx[19].end 425.129
transcript.whisperx[19].text 就是像他們跟衛報買相關內容一樣作為繁中語料在整個OpenAI的模型或是其他廠商的模型當中是有意義的所以我這邊是快速雖然你在新聞稿上說這個其實需要花一些時間來我們下一張最後我的建議是說我們有沒有機會請書發部跟專家學者受到影響產業代表制裁局 國科會 文化部等相關單位嚴寧相關的進度我希望有機會在三個月內召開會議六個月內提供相關規劃報告是有機會的嗎
transcript.whisperx[20].start 427.597
transcript.whisperx[20].end 440.05
transcript.whisperx[20].text 是我們報告員我們會朝這個方向努力好我想所有內容業者跟所謂的AI廠商都非常期待在部會的協調之下真的幫他們找到一個合理的而且合法的對話窗口好嗎好謝謝次長謝謝主席謝謝謝謝委員謝謝