Sora登場,舉座皆驚。繼文字、圖片和音頻之后,人類創造力的最后堡壘——視頻,已被AI攻破。有人宣告普羅大眾將實現“視頻自由”,從此往后人人都能自產栩栩如生、流暢高清的視頻作品,影視、游戲、廣告行業將被徹底顛覆。
Sora是否已經真正“理解”了物理世界與人類精神世界的運行規則,暫且留給科學家們繼續爭論。但我們真的會迎來一個人人皆可成為專業視頻博主、集體創造力躍升的時代嗎?
多半不會。
想一想在視頻之前,上一次被技術“民主化”了的內容制作技術——數碼相片。自從世界上第一臺內置攝像頭的手機在2000年面世,人類每年拍攝的數碼相片飛速增長。僅2023年,世界各地的人們總共拍攝了1.8萬億張照片——平均每天50億張,每秒5.7萬張——遠超人類歷史上所有繪畫數量的總和。
如此巨量的數碼照片,可以被視作資料和數據,但從人類“創作”的角度來說,價值幾乎為零。能被稱作藝術創作的攝影作品只是極小一部分,通常來自專業人士。
和此前的數字技術革新一樣,Sora又被寄予了“技術平權”的厚望,樂觀者堅信它能讓普通人變得更強大。Sora的確能大幅降低視頻制作的技術門檻,但相比于人人都能變成視頻大師,更可能的現實是,它將再一次拉大創造力天才與普通人之間的差距。
正像當年社交媒體剛興起時,我們也曾以為普羅大眾都將擁有平等的被“聽見”的機會,結果卻是馬太效應讓強者愈強,絕大多數的注意力被很小一群頭部賬號攫取。
在一個信息已經過載的時代,人類還能拿出多少注意力分給由技術生成的信息,也是一個未知。全世界的人類每天能生產約100萬億字的內容,而目前OpenAI每天已經能創造出約1,000億字。據稱微軟向OpenAI提供了5,000億條視頻用于Sora的訓練。Sora一旦開放API接口,將有更多海量視頻數據向它涌去,喂養它生成更多的視頻內容。
但終日沉浸于視頻的汪洋中,不間斷接受光影聲效的轟炸,恐怕也不是我們想要的日常。
在所有內容形式中,視頻對感官的刺激最為強烈,而刺激的閾值會不斷升高。如果視頻的影音效果不是越發震撼,情節不是越發奇詭,我們可能很快就會生出倦怠感。技術專家說,基于目前的參數,Sora能夠生成的黃河路影像,已經可以比王家衛《繁花》鏡頭下的更絢爛奪目。但我們也可能像寶總一樣,黃河路上的衣香鬢影越是濃稠,越是思念一碗清水泡飯。
已經有好幾位朋友說,Sora的到來,只會讓他們加速斷網,退回紙面閱讀。文字就像米飯青菜,比起大魚大肉更不容易厭倦。
有人文學者擔心,視頻內容的泛濫,會讓人類喪失部分審美能力,比如在面對雋永的文字、空靈的音樂時。
而更讓人憂心的是,我們也在加速喪失對何為“真實”的把控力。
生成式AI開始海量輸出的“合成”(synthetic)內容,讓真與假之間的界限越發模糊。2023年,人們在韋氏詞網站上搜索最多的一個詞是“authentic”(真實),反映的正是我們面對的真實性危機。微軟中國的首席技術官韋青近日說:這個時代,能夠不被騙是最大的福報。
真實性危機最糟糕之處,是真假難辨之間,真實反而需要付出更多代價證明自己為真。一位朋友的孩子在美國讀小學,最近花了很多功夫寫成一篇閱讀報告后,被老師質疑為ChatGPT所作,孩子有口難辯,倍感委屈。
Sora對現實世界的逼真模擬,讓人們擔心“深度偽造”(deepfake)視頻將大舉入侵我們的生活。在一個全球大選年,這類視頻一旦變成政治武器,甚至可能影響人類社會的整體走向。
AI應用眼下正是“亂花漸欲迷人眼”,但正如我的同事在一篇文章中說,不要喪失對語言和文化的敬畏之心,因為所有的大模型都依賴人類的存量知識和創意。
而相比于知識與創意,人之本真(authenticity)更值得珍守。換句話說,就算我們愿意與AI分享我們所有的知識與創意,以獲取效率和便利,我們也不能放任它侵蝕我們對真相、對“我是誰”的認知。不然,我們就是在與技術做一場浮士德的交換。
《繁花》里的寶總說:黃河路十只澳龍,換不來一碗泡飯。泡飯即本真。Sora鏡頭中的黃河路越是絢爛,我們就越要去守住自己的那一碗。(財富中文網)