IVOD_ID |
160907 |
IVOD_URL |
https://ivod.ly.gov.tw/Play/Clip/1M/160907 |
日期 |
2025-05-01 |
會議資料.會議代碼 |
聯席會議-11-3-23,22-1 |
會議資料.會議代碼:str |
第11屆第3會期交通、教育及文化委員會第1次聯席會議 |
會議資料.屆 |
11 |
會議資料.會期 |
3 |
會議資料.會次 |
1 |
會議資料.種類 |
聯席會議 |
會議資料.委員會代碼[0] |
23 |
會議資料.委員會代碼[1] |
22 |
會議資料.委員會代碼:str[0] |
交通委員會 |
會議資料.委員會代碼:str[1] |
教育及文化委員會 |
會議資料.標題 |
第11屆第3會期交通、教育及文化委員會第1次聯席會議 |
影片種類 |
Clip |
開始時間 |
2025-05-01T12:12:15+08:00 |
結束時間 |
2025-05-01T12:19:38+08:00 |
影片長度 |
00:07:23 |
支援功能[0] |
ai-transcript |
video_url |
https://ivod-lyvod.cdn.hinet.net/vod_1/_definst_/mp4:1MClips/872e8bbe37846fc08216e9afc0e827182bf9a8039e28b7cac64ac1618a5937c6fd113443f1ac9aa35ea18f28b6918d91.mp4/playlist.m3u8 |
委員名稱 |
陳培瑜 |
委員發言時間 |
12:12:15 - 12:19:38 |
會議時間 |
2025-05-01T09:00:00+08:00 |
會議名稱 |
立法院第11屆第3會期交通、教育及文化委員會第1次聯席會議(事由:一、審查委員林楚茵等17人擬具「新聞媒體與數位平台議價法草案」案。二、審查委員羅廷瑋等16人擬具「新聞媒體與數位平臺強制議價法草案」案。三、審查委員王鴻薇等20人擬具「新聞媒體與數位平臺強制議價法草案」案。四、審查台灣民眾黨黨團擬具「新聞媒體與數位科技平台公平發展法草案」案。五、審查委員林宜瑾等21人擬具「數位新聞發展與民主韌性法草案」案。六、審查委員范雲等21人擬具「數位新聞發展與民主韌性法草案」案。
【僅進行詢答】) |
transcript.pyannote[0].speaker |
SPEAKER_01 |
transcript.pyannote[0].start |
0.80721875 |
transcript.pyannote[0].end |
9.29534375 |
transcript.pyannote[1].speaker |
SPEAKER_00 |
transcript.pyannote[1].start |
7.18596875 |
transcript.pyannote[1].end |
7.87784375 |
transcript.pyannote[2].speaker |
SPEAKER_00 |
transcript.pyannote[2].start |
13.75034375 |
transcript.pyannote[2].end |
14.23971875 |
transcript.pyannote[3].speaker |
SPEAKER_01 |
transcript.pyannote[3].start |
14.23971875 |
transcript.pyannote[3].end |
115.97909375 |
transcript.pyannote[4].speaker |
SPEAKER_00 |
transcript.pyannote[4].start |
34.62471875 |
transcript.pyannote[4].end |
34.91159375 |
transcript.pyannote[5].speaker |
SPEAKER_01 |
transcript.pyannote[5].start |
116.87346875 |
transcript.pyannote[5].end |
125.86784375 |
transcript.pyannote[6].speaker |
SPEAKER_01 |
transcript.pyannote[6].start |
126.42471875 |
transcript.pyannote[6].end |
173.53971875 |
transcript.pyannote[7].speaker |
SPEAKER_00 |
transcript.pyannote[7].start |
161.71034375 |
transcript.pyannote[7].end |
162.04784375 |
transcript.pyannote[8].speaker |
SPEAKER_00 |
transcript.pyannote[8].start |
163.71846875 |
transcript.pyannote[8].end |
163.73534375 |
transcript.pyannote[9].speaker |
SPEAKER_00 |
transcript.pyannote[9].start |
174.02909375 |
transcript.pyannote[9].end |
240.66846875 |
transcript.pyannote[10].speaker |
SPEAKER_01 |
transcript.pyannote[10].start |
183.79971875 |
transcript.pyannote[10].end |
184.59284375 |
transcript.pyannote[11].speaker |
SPEAKER_01 |
transcript.pyannote[11].start |
216.21659375 |
transcript.pyannote[11].end |
216.67221875 |
transcript.pyannote[12].speaker |
SPEAKER_01 |
transcript.pyannote[12].start |
217.11096875 |
transcript.pyannote[12].end |
217.92096875 |
transcript.pyannote[13].speaker |
SPEAKER_01 |
transcript.pyannote[13].start |
233.61471875 |
transcript.pyannote[13].end |
234.93096875 |
transcript.pyannote[14].speaker |
SPEAKER_01 |
transcript.pyannote[14].start |
240.66846875 |
transcript.pyannote[14].end |
244.19534375 |
transcript.pyannote[15].speaker |
SPEAKER_00 |
transcript.pyannote[15].start |
240.70221875 |
transcript.pyannote[15].end |
241.69784375 |
transcript.pyannote[16].speaker |
SPEAKER_01 |
transcript.pyannote[16].start |
244.39784375 |
transcript.pyannote[16].end |
274.26659375 |
transcript.pyannote[17].speaker |
SPEAKER_00 |
transcript.pyannote[17].start |
270.11534375 |
transcript.pyannote[17].end |
270.45284375 |
transcript.pyannote[18].speaker |
SPEAKER_01 |
transcript.pyannote[18].start |
274.35096875 |
transcript.pyannote[18].end |
294.02721875 |
transcript.pyannote[19].speaker |
SPEAKER_00 |
transcript.pyannote[19].start |
291.22596875 |
transcript.pyannote[19].end |
291.47909375 |
transcript.pyannote[20].speaker |
SPEAKER_00 |
transcript.pyannote[20].start |
294.02721875 |
transcript.pyannote[20].end |
294.29721875 |
transcript.pyannote[21].speaker |
SPEAKER_01 |
transcript.pyannote[21].start |
294.29721875 |
transcript.pyannote[21].end |
310.83471875 |
transcript.pyannote[22].speaker |
SPEAKER_01 |
transcript.pyannote[22].start |
311.59409375 |
transcript.pyannote[22].end |
321.88784375 |
transcript.pyannote[23].speaker |
SPEAKER_00 |
transcript.pyannote[23].start |
322.03971875 |
transcript.pyannote[23].end |
334.96596875 |
transcript.pyannote[24].speaker |
SPEAKER_01 |
transcript.pyannote[24].start |
332.83971875 |
transcript.pyannote[24].end |
336.18096875 |
transcript.pyannote[25].speaker |
SPEAKER_00 |
transcript.pyannote[25].start |
335.69159375 |
transcript.pyannote[25].end |
382.01346875 |
transcript.pyannote[26].speaker |
SPEAKER_01 |
transcript.pyannote[26].start |
381.82784375 |
transcript.pyannote[26].end |
426.93471875 |
transcript.pyannote[27].speaker |
SPEAKER_00 |
transcript.pyannote[27].start |
384.30846875 |
transcript.pyannote[27].end |
384.52784375 |
transcript.pyannote[28].speaker |
SPEAKER_00 |
transcript.pyannote[28].start |
427.50846875 |
transcript.pyannote[28].end |
430.42784375 |
transcript.pyannote[29].speaker |
SPEAKER_01 |
transcript.pyannote[29].start |
430.42784375 |
transcript.pyannote[29].end |
443.10096875 |
transcript.pyannote[30].speaker |
SPEAKER_00 |
transcript.pyannote[30].start |
440.80596875 |
transcript.pyannote[30].end |
441.61596875 |
transcript.pyannote[31].speaker |
SPEAKER_00 |
transcript.pyannote[31].start |
442.61159375 |
transcript.pyannote[31].end |
442.64534375 |
transcript.pyannote[32].speaker |
SPEAKER_01 |
transcript.pyannote[32].start |
443.18534375 |
transcript.pyannote[32].end |
443.97846875 |
transcript.whisperx[0].start |
0.782 |
transcript.whisperx[0].end |
7.416 |
transcript.whisperx[0].text |
好 謝謝主席我可以直接請那個述發部的林次長嗎林次長好 謝謝 |
transcript.whisperx[1].start |
14.52 |
transcript.whisperx[1].end |
33.753 |
transcript.whisperx[1].text |
市長午安 我其實從這個新聞溢價法媒體溢價法 我其實直接想跟你討論其實就是四個字叫做內容有價因為不管是在過去新聞媒體時代或者是現在所謂的大型語言模型就是所謂大家日常現在用的非常習慣的chat GPT其實這些語料模型背後都需要有意義的 |
transcript.whisperx[2].start |
34.253 |
transcript.whisperx[2].end |
57.161 |
transcript.whisperx[2].text |
資料是那我們來看一下現在的狀態是這樣來下一張在台灣其實二零二五年的一月二十雜誌公會他們推內容有價侵權有罪這件事情而且有相關的訴訟正在進行我相信你是清楚的我就不再贅述其實不只新聞媒體的內容有價過去傳統出版產業的內容也是有價的那在訓練這些餘料模型上來往下看 |
transcript.whisperx[3].start |
57.961 |
transcript.whisperx[3].end |
79.697 |
transcript.whisperx[3].text |
我們回到加拿大他們有這個負面的例子就是跟台灣一樣他們控告OpenAI在未經許可而且沒有付費的情況下盜取新聞機構數以百萬計受版權保護的文章於是呢這五個新聞機構就對OpenAI提起訴訟那目前訴訟正在進行中這個是比較負面的例子跟台灣一樣可是我們也看到正面的例子我們來看一下 |
transcript.whisperx[4].start |
80.217 |
transcript.whisperx[4].end |
105.87 |
transcript.whisperx[4].text |
Chubb GPT花錢跟很多英國媒體從衛報開始整個大型媒體集團開始用付費的方法授權使用這個資料尤其在Chubb GPT的Search版我們看到他們所用的都是這些我們認為非常精緻的語料資料餵給這個模型然後於是產出的內容就變得相對有意義那其實很多使用者也都大聲叫好但是我要說 |
transcript.whisperx[5].start |
106.59 |
transcript.whisperx[5].end |
125.157 |
transcript.whisperx[5].text |
有訴訟的部分也有合理授權 合法授權 付錢的部分所以看起來這件事情此時此刻正在世界上發生好 下一張我看到速發部在3月3號有這個新聞稿我相信這應該是速發部主動提供的次長您在相關的媒體報導中 您說 |
transcript.whisperx[6].start |
126.497 |
transcript.whisperx[6].end |
148.17 |
transcript.whisperx[6].text |
建立台湾主权AI训练的语料库松绑著作权法而且要免费提供训练语料给国内国外的大型语言模型让他们使用台湾的资料减少AI厂商跟内容拥有者的著作权纠纷我从一路讲到现在意思就是说我们台湾的书发布看起来 |
transcript.whisperx[7].start |
148.61 |
transcript.whisperx[7].end |
172.908 |
transcript.whisperx[7].text |
知道世界的趨勢就是有訴訟的部分也有合法合理授權的部分看起來速發部現在在這件事情上想要採一個角色就是協助內容擁有者跟語料廠商AI廠商找到一個合作的可能性而不要去採進訴訟這件事情所以您剛剛說在這個新聞稿當說要免費提供訓練語料我想要說一下這個idea是怎麼來的 |
transcript.whisperx[8].start |
174.64 |
transcript.whisperx[8].end |
191.195 |
transcript.whisperx[8].text |
因為我們在於說我們拿一些資料去訓練AI的model的時候到底這些AI model的廠商要不要付費來取得這些資料給這些內容擁有者這件事情本身是一個兩難一方面就是說那個內容的擁有者他覺得說我覺得要收錢 |
transcript.whisperx[9].start |
192.196 |
transcript.whisperx[9].end |
207.753 |
transcript.whisperx[9].text |
可是對於這些大型的AI模型來講的話其實我也跟他們溝通過他們對於說使用台灣的資料來訓練他們的模型他們事實上是很有疑慮的事實上不是因為他們付不起錢而是他們擔心會侵權 |
transcript.whisperx[10].start |
209.435 |
transcript.whisperx[10].end |
232.441 |
transcript.whisperx[10].text |
因為他們需要而且他們覺得說他要花很多的時間去跟台灣的內容擁有者去做那個談判他們擔心的是這個部分那結果造成的狀況呢是說像那個ChatterGPT或者是LAMA或者是這種外國的模型他在選擇那個中文語料庫的時候他們常常是拿中國的語料庫因為中國比較不注重 |
transcript.whisperx[11].start |
232.981 |
transcript.whisperx[11].end |
260.901 |
transcript.whisperx[11].text |
那個知識財產權所以那個變得比較容易比較沒有法律風險那結果最後的結果是很不好的就是當我們用中文問問題的時候可能就會產出Garbage in garbage out的問題所以我先肯定書法部在這件事情上先踩住了一個立場就是要協助所謂的內容擁有者跟國內外的AI廠商但問題也就來了當你已經先喊出想辦法先找到免費授權 |
transcript.whisperx[12].start |
261.821 |
transcript.whisperx[12].end |
278.998 |
transcript.whisperx[12].text |
或者是沒有著作權為優先各式各樣的語料資料我覺得這是很重要的一步但是我自己來自於所謂內容產業界我必須要說台灣的內容產業界不論是來下一張不論是好先直接跳下一張我要說台灣的 |
transcript.whisperx[13].start |
279.839 |
transcript.whisperx[13].end |
301.56 |
transcript.whisperx[13].text |
生產內容的這些創作者不管是像楊雙子最近得了美國國家圖書獎或者是很棒的動畫廠商或者是我們在波羅納得大獎的插畫家這些都還只是我簡單的舉例這些有意義的而且高品質的素材其實可能才是下一步速發步你們的挑戰也就是我們剛開始先促成了這個合作的橋樑可是 |
transcript.whisperx[14].start |
302.681 |
transcript.whisperx[14].end |
320.413 |
transcript.whisperx[14].text |
當餘料廠商這些AI廠商他們說我們想要更多很棒的資料協助我們產出有意義的內容的時候公司的發展是有價值的速發部未來要如何協助協同文化部協助這些內容擁有者真的可以找到一個合理的對談模式之餘對這些AI廠商 |
transcript.whisperx[15].start |
322.543 |
transcript.whisperx[15].end |
335.5 |
transcript.whisperx[15].text |
首先在政策上面我們是主張就是說如果沒有經過正式的授權的話這些語言模型它不能隨便拿台灣的這些語調去當然這個非常非常重要免得遇到像加拿大那個訴訟一樣 |
transcript.whisperx[16].start |
338.043 |
transcript.whisperx[16].end |
354.459 |
transcript.whisperx[16].text |
除了那些免費的我們提供免費的以外我們認為說高品質的語料其實應該是正式取得授權而且付費那我們就想辦法在法律上面我們跟文化部一起合作想辦法建立出一個規則然後一個計價的方法降低這個 |
transcript.whisperx[17].start |
355.68 |
transcript.whisperx[17].end |
381.849 |
transcript.whisperx[17].text |
這個negotiation的那個成本這樣子的話不管是台灣或者是國外的這些那個大型元模型LLM他們就會更方便更快速的取得這些這些餘料就如同我們剛才所講的其實他們真正在乎的不是他付多少錢因為對他們來講這些錢不是很大的金額他們在乎的是這個那個協商的成本以及這個法律清錢的那個可能性 |
transcript.whisperx[18].start |
382.049 |
transcript.whisperx[18].end |
396.718 |
transcript.whisperx[18].text |
還有就是跨國文化之間的不同啦我必須要這麼說你讓這些open air的廠商他到台灣來要找到這些內容擁有者直接對話其實是困難的但是我透過速發部跟文化部合作的平台真的在假以時日我們真的希望在台灣我們可以聽到很棒的case |
transcript.whisperx[19].start |
397.378 |
transcript.whisperx[19].end |
425.129 |
transcript.whisperx[19].text |
就是像他們跟衛報買相關內容一樣作為繁中語料在整個OpenAI的模型或是其他廠商的模型當中是有意義的所以我這邊是快速雖然你在新聞稿上說這個其實需要花一些時間來我們下一張最後我的建議是說我們有沒有機會請書發部跟專家學者受到影響產業代表制裁局 國科會 文化部等相關單位嚴寧相關的進度我希望有機會在三個月內召開會議六個月內提供相關規劃報告是有機會的嗎 |
transcript.whisperx[20].start |
427.597 |
transcript.whisperx[20].end |
440.05 |
transcript.whisperx[20].text |
是我們報告員我們會朝這個方向努力好我想所有內容業者跟所謂的AI廠商都非常期待在部會的協調之下真的幫他們找到一個合理的而且合法的對話窗口好嗎好謝謝次長謝謝主席謝謝謝謝委員謝謝 |