機(jī)器人記者,像人一樣內(nèi)容創(chuàng)作觀點(diǎn)
本文來源紐約時(shí)報(bào),作者SHELLEY PODOLNY,由機(jī)器之心獨(dú)家翻譯出品,參與成員:電子羊、青澤萌。
讓我猜猜看,你認(rèn)為你閱覽的內(nèi)容出自真人之手。也許你是對(duì)的,也許并不是那回事。或許你得問問我,當(dāng)你填鴨式地將那些抽象藝術(shù)般的字母和數(shù)字鍵入那個(gè)煩人的小盒子時(shí),你電腦如何行事。
因?yàn)椋F(xiàn)如今,計(jì)算機(jī)算法而非人類創(chuàng)造的閱讀內(nèi)容數(shù)量之巨令人震驚。我們也許該懷疑一下,7天24小時(shí)不間斷向我們襲來的信息不可能全都來自伏在筆記本電腦前的人類。
這不難理解。眾多數(shù)字渠道催生的內(nèi)容需求已非人力所及。這種需求,配上前所未有的復(fù)雜技術(shù),催生了「自動(dòng)化故事生產(chǎn)」(automated narrative generation)行業(yè)。
從事這樁生意的公司旨在借助算法和自然語(yǔ)言生成器創(chuàng)建文字內(nèi)容從而將人類從寫作過程的負(fù)擔(dān)中解脫出來。為平臺(tái)提供一些數(shù)據(jù)——比如財(cái)務(wù)收入數(shù)據(jù),嗖的一聲,幾秒鐘內(nèi),故事就寫好了,要什么樣的故事就給你什么樣的故事。
這些機(jī)器作家可不僅僅是機(jī)械地復(fù)述數(shù)據(jù),它們創(chuàng)作出聽上去像是人類寫的故事,有求必應(yīng)——古板的、時(shí)髦的,符合目標(biāo)群體的口味,甚至可以因人而異,就那么機(jī)智炫酷。當(dāng)你閱讀這些成果時(shí),你永遠(yuǎn)也猜不到作者根本沒有心跳。
來看看兩則體育報(bào)道:
「已經(jīng)落后兩場(chǎng)的洛杉磯道奇隊(duì)在第九場(chǎng)中似乎無力回天了,但多虧 Vladimir Guerrero的關(guān)鍵一擊,洛杉磯反敗為勝,最終在周日芬威公園的比賽中以7比6的比分戰(zhàn)勝了波士頓紅襪隊(duì)。」
「密歇根大學(xué)棒球隊(duì)在第五局得四分,拯救了連續(xù)三個(gè)周末的最后一場(chǎng)比賽,4月24日,星期六下午,他們?cè)赪ilpon 棒球場(chǎng)(歷史上的Ray Fisher 體育場(chǎng)) 以7比5的比分戰(zhàn)勝了愛荷華大學(xué)。」
如果你猜不出來哪個(gè)是出自人手,你不在少數(shù)。根據(jù)瑞典卡爾斯塔德大學(xué)Christer Clerwall 發(fā)表在《新聞實(shí)踐》上的研究,當(dāng)和類似的體育報(bào)道混在一起時(shí),受試者根本看不出區(qū)別。(順便說一句,在以上的例子里,第一段是機(jī)器寫的,第二段是人寫的。)
算法和自然語(yǔ)言生成器出現(xiàn)有一段時(shí)間了,隨著需求與日俱增,刺激了投資和創(chuàng)新,它們做得更快更好了。我們產(chǎn)生的大數(shù)據(jù)陡增的體量和復(fù)雜程度已經(jīng)超出單純?nèi)肆μ幚淼姆秶獜钠渲屑橙∫饬x必須要人工智能而非人類智能。
這些新的軟件平臺(tái)運(yùn)用先進(jìn)的指標(biāo)來識(shí)別模式、趨勢(shì)和數(shù)據(jù)異常,使得金礦的價(jià)值大放異彩,尤其是在數(shù)據(jù)豐富的諸如金融、體育和商業(yè)領(lǐng)域。然后它們迅速滲入解釋性報(bào)道,作為機(jī)器記者介入進(jìn)來,以取代人類。
美聯(lián)社每季度借助Automated Insights的Wordsmith平臺(tái)創(chuàng)作的金融報(bào)道達(dá)到3000多篇。蘋果公司發(fā)布會(huì)數(shù)分鐘內(nèi),它就發(fā)表了關(guān)于破紀(jì)錄收入的報(bào)道。與此類似,福布斯則使用Narrative Science的Quill 平臺(tái),并將Narrative Science作為親密的合作伙伴。
還有 Quakebot,洛杉磯時(shí)報(bào)用以分析地質(zhì)數(shù)據(jù)的算法。去年南加州發(fā)生了4.7級(jí)地震,它是首篇新聞報(bào)道的作者,事件發(fā)生幾分鐘后,洛杉磯時(shí)報(bào)網(wǎng)站上就發(fā)布了該報(bào)道。洛杉磯時(shí)報(bào)還借助算法來改善兇殺案報(bào)道。
但我們略可放心。畢竟對(duì)我們而言,這些軟件的處理過程近乎黑箱,它們可能偏向一些前提規(guī)范,或者包含一些我們無法辨別的偏見。更何況,在處理相同信息時(shí),一個(gè)好奇的、想象力豐富的人類可能夾帶一些私人洞見,這些可能會(huì)被遺漏。
這些頌歌無非是在宣揚(yáng)老一套的「解放」主題:機(jī)器記者會(huì)使人類從數(shù)據(jù)處理工作中解脫出來,而進(jìn)行更多報(bào)道。
這很好,但是Narrative Science的聯(lián)合創(chuàng)始人Kristian Hammond估計(jì),到本世紀(jì)20年代,90%的新聞將由算法寫成,大部分甚至不需要人為干預(yù)。如果這一預(yù)測(cè)足夠準(zhǔn)確,將引發(fā)連鎖效應(yīng)。
現(xiàn)在主要是機(jī)器記者,但并不會(huì)就此止步。隨著軟件逐步取代我們成為傳播者,算法內(nèi)容正迅速滲透到我們文化的各個(gè)角落,從公共事務(wù)到足球,再到你下雙鞋的評(píng)論。
Automated Insights 稱,它們旗下的軟件去年創(chuàng)作了十億個(gè)故事,大部分沒有人為干預(yù),在它和Narrative Science的主頁(yè)上,它們客戶的我們眾所周知:三星、康卡斯特、美聯(lián)社、Edmunds.com和雅虎。你或許沒有注意到,但你絕對(duì)不可能沒有閱讀過它們生產(chǎn)的內(nèi)容。
書也能由機(jī)器寫就。看看歐洲工商管理學(xué)院管理科學(xué)教授Philip M. Parker:他的算法系統(tǒng)已經(jīng)獲得專利,這套系統(tǒng)生產(chǎn)了100多萬本書,其中10萬本以上都在亞馬遜上出售。他說,給他一個(gè)技術(shù)方面的或者深?yuàn)W的主題,他的系統(tǒng)會(huì)挖掘數(shù)據(jù)并寫成一本書或一份報(bào)告,模仿一個(gè)就此主題展開寫作的人的思維過程。
Narrative Science則表示,它能創(chuàng)作出「無法區(qū)分出作者是人還是機(jī)器的故事」。Automated Insights 表示,它擅長(zhǎng)像人類一樣寫作。但正是這些讓我遲疑了。「像人一樣」這個(gè)短語(yǔ)事實(shí)上成為了插入語(yǔ),不僅是內(nèi)容創(chuàng)造,當(dāng)我們談及大多數(shù)技術(shù)時(shí)都會(huì)這么講。
我們的手機(jī)會(huì)像人一樣和我們說話,我們的家具會(huì)像人一樣服從命令,我們的汽車會(huì)像人一樣自駕。那「人」到底意味著什么?
隨著技術(shù)的發(fā)展,進(jìn)化的下一步似乎總是合乎邏輯的,而那正是危險(xiǎn)所在。在一次次的誘惑下,我們一點(diǎn)點(diǎn)地放棄了自我的一部分。我們很少退一步思考,最終我們是否得不償失。再說,誰有時(shí)間去考慮哪些,畢竟每天要吸收那么多信息,而我們終究是只普通人。
1.砍柴網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;2.砍柴網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:砍柴網(wǎng)",不尊重原創(chuàng)的行為砍柴網(wǎng)或?qū)⒆肪控?zé)任;3.作者投稿可能會(huì)經(jīng)砍柴網(wǎng)編輯修改或補(bǔ)充。
- 馬云:態(tài)度比能力重要 選擇同樣比能力重要
- 中國(guó)瘋狂的電影票房與“口紅效應(yīng)”
- 谷歌nexus 6P可助華為提升形象,但實(shí)際意義有限?
- 黃曉明&Angelababy:男VC娶了女VC 估值超3億
- 萬能的大熊:營(yíng)銷文案好有個(gè)毛用
- Q2營(yíng)收斷崖式暴跌,黑莓應(yīng)學(xué)諾基亞果斷轉(zhuǎn)型
- 對(duì)抗印度,硅谷華人正在崛起
- 透過寒冬期的O2O,看O2O的演化
- 認(rèn)為手機(jī)成掌機(jī)最大阻礙,索尼服軟為哪般
- 繼“58趕集們”之后,美團(tuán)與大眾點(diǎn)評(píng)為什么又在一起?