久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频

您當前的位置: 首頁 > 新聞 > 其他

用ChatGPT寫作業?新算法給AI生成文本加水印:置信度高達99.999999999994%

來源:量子位   編輯:非小米 時間:2023-02-08 07:32人閱讀

AI生成文本,又遇新對手!

憑借識別AI生成文本中的“水印”,一種新算法能夠準確判斷文本到底是誰寫的。

無需訪問模型參數、API,結果置信度高達99.999999999994%

用ChatGPT寫作業?新算法給AI生成文本加水印:置信度高達99.999999999994%

方法一經發布就引來大量網友圍觀。這回拿ChatGPT“作弊”,怕不是要更難了?

要知道,最近一段時間,ChatGPT先是成為美國高中生的寫作業利器,后面幫專業媒體寫稿子,引發巨大恐慌。如Nature、紐約教育部等,都針對ChatGPT發布禁令。

馬里蘭大學學者們提出的這一新方法,為解決這些麻煩提出了個新思路。

不少網友都覺得,這個方法提出的正是時候,而且效果看著也不錯。

有學者還和美國高中生喊話,你們要做好準備了!

作者表示,方法代碼將在2月15日免費開源。

計算文本由AI生成的概率

所謂模型水印,人類無法看到,但是計算機可以。

這是一種現在被常用于大規模語言模型(LLM)中的方法,能讓AI生成的文本帶有“特殊標記”。即把信號嵌入到生成的文本中,讓算法能從一小段token中檢測出來。

最近,OpenAI方面也表示,考慮在ChatGPT中添加水印,以降低模型被濫用帶來的負面影響。

這篇最新論文的作者,就想驗證下這個想法到底靠不靠譜。他們通過給LLM中嵌入水印,然后再進行檢測。其中水印的嵌入不會影響文本生成質量。

具體來說,大規模語言模型每次生成一個token,每個token將從包含大約5萬個詞匯的詞匯表中進行選擇。

在新token生成之前,該方法會從基于最近已生成的token為隨機數生成器(RNG)提供“種子”,以此來壓一個水印。

然后使用RNG,能將詞匯表分為黑名單白名單,并要求LLM接下來只能從白名單中選擇詞匯。

如果整段文本中,白名單中的詞匯越多,就意味著越有可能是AI生成的

黑白名單的區分,基于一個原則:

人類使用詞匯的隨機性更強。

舉例來說,如果在“美麗的”后面生成詞匯,水印算法會將“花”列入白名單,將“蘭花”列入黑名單。

論文作者認為,AI更可能使用“花”這個詞匯,而不是“蘭花”。

然后,就能通過計算整段文本中白名單token出現的情況,來檢測水印。

如果一共有生成了N個token,所有的token都使用了白名單詞匯,那么這段文字只有2的N次方分之一概率是人類寫的。

即便這段文字只有25個詞組成,那么水印算法也能判斷出它到底是不是AI生成的。

但作者也表示,水印有時候也不一定完全靠譜。

比如模型輸出了“SpongeBob Square”,下一個單詞一定會是“Pants”吧?但是Pants會被標記到黑名單里,即認為是只有人才會寫的詞。

(注:SpongeBob SquarePants是《海綿寶寶》動畫片的英文,可理解為一個專有名詞)

這種情況會嚴重影響算法的準確性,因此作者將其定義為低熵token,因為模型幾乎不會有更好的選擇。

對應來看,也會有高熵token,比如“海綿寶寶感覺____”這個句式里,能填入的詞匯太多了。

對于這一情況,作者選擇針對高熵token制定更強的規則,同時保留低熵token,確保水印質量更好。

與此同時,他們還添加了波束搜索(Beam search),允許LLM能夠排布一整個token序列,以避免黑名單詞匯。

這么做,他們能確保LLM使用白名單詞匯的概率在大約80%左右,而且不影響文本生成質量。

舉例來看,對于下面這段文字,水印算法認為它有99.999999999994%的可能是由AI生成的。

因為在這段文字中,包含36個token。如果是人類寫的,那么文本中應該包含9±2.6個白名單詞匯(白名單詞匯的概率約為25%)。

但這段文字中,包含了28個白名單詞匯。

計算來看,這段文字由人類寫出的概率,僅有0.0000000000006% (6乘以10的-15次方)。

用ChatGPT寫作業?新算法給AI生成文本加水印:置信度高達99.999999999994%

如下標注的是文本中的黑名單token。

用ChatGPT寫作業?新算法給AI生成文本加水印:置信度高達99.999999999994%

需要注意的是,如果想要水印正常發揮作用,并不受到攻擊,就必須對文本進行一些標準化處理,并且需要檢測某些類型的對抗性提示。

這一方法是對外公開的,將在2月15日開源代碼。

加一個隨機秘鑰,也能變成保密模式并且托管到API上,這能保證水印不會被篡改。

論文中使用的模型是Meta開源的OPT-1.3B模型。

由于不用訪問底層模型,所以該檢測方法的速度很快,成本也不會很高。

而且可以使用標準語言模型生成帶水印的文本,不用再重新訓練。

網友:似乎很容易繞過?

巴特,不少網友覺得,這個方法的具體實踐效果可能遠不及理想,質疑之聲迭起。

有人提出:

如果我在AI生成的文字基礎上,修改幾個詞,還能被查出來嗎?那在替換成近義詞后,檢測準確率會下降多少?

畢竟大家往往不會一字不改、直接用AI生成的內容。

用ChatGPT寫作業?新算法給AI生成文本加水印:置信度高達99.999999999994%

對此,論文通訊作者、馬里蘭大學副教授Tom Goldstein回答稱:

對于一段自帶水印的文字,至少得修改40%-75%的token,才可能成功去除水印。

(如果用其他程序修改內容話),為發生同義詞攻擊,導致生成內容的質量很低。

用ChatGPT寫作業?新算法給AI生成文本加水印:置信度高達99.999999999994%

簡而言之,想要通過換近義詞來消除水印,得大篇幅修改,而且若不是人親自手動修改的話,效果會很拉胯。

還有人提出:

對于專門設計過的低熵token序列,應該能檢測出水印。但是,長度和檢測率之間(存在一些矛盾),它們的優先級應該如何權衡?

對此,Tom教授表示:

根據設定,使用波束搜索時,絕大多數(通常是90%)的token在白名單上,即使是低熵token,也會被列入白名單。

所以,至少得修改一半以上的token,才能刪除水印,而這需要一個超級強大的LLM模型才行,一般人很難接觸到。

不過,研究者們也在論文中承認,這種方法確實存在一些局限性。

比如,檢測水印的z統計量,只取決于白名單大小參數γ和生成白名單的哈希函數,和其他不少重要的參數并沒有什么相關性。

這就讓他人可以在下游水印檢測器上做手腳,可以改變水印采樣算法,重新部署水印,最終讓原本生成的水印失效。

就連OpenAI CEO Sam Altman也表示:

創造完美檢測AI抄襲的工具,從根本上來說是不可能的。

(盡管他說OpenAI打算啟用水印大法)

但話說回來,人們為了限制AI生成文字的負面影響,還是煞費苦心——

之前就有人搞出了一個檢測ChatGPT的網站,名曰GPTZero,只需要把相應的內容粘進去,幾秒內就能分析出結果。

用ChatGPT寫作業?新算法給AI生成文本加水印:置信度高達99.999999999994%

論文地址:https://arxiv.org/abs/2301.10226

本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。

如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com

標簽: ChatGPT 大模型

相關文章

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频
国产日韩欧美精品在线| 亚洲男人天堂2024| 老鸭窝毛片一区二区三区 | 欧美chengren| 亚洲欧洲一区二区三区在线观看 | 欧美日本一道本在线视频| 亚洲欧洲日本专区| 亚洲六月丁香色婷婷综合久久| 欧美日韩免费区域视频在线观看| 亚洲视频在线免费观看| 亚洲一区二区三区久久 | 久久香蕉国产线看观看av| 亚洲国产美女精品久久久久∴| 亚洲国产一区二区a毛片| 欧美乱人伦中文字幕在线| 欧美一级视频| 久久久久久久综合| 一区二区三区成人精品| 中国成人亚色综合网站| 欧美高潮视频| 亚洲欧美日韩国产一区二区| 欧美大片免费| 日韩亚洲欧美成人| 欧美国产高潮xxxx1819| 欧美精品97| 中文日韩在线视频| 国产精品一区二区三区乱码| 国产乱码精品一区二区三| 在线观看91精品国产麻豆| 欧美成人首页| 久久久久久免费| 亚洲高清一区二区三区| 日韩亚洲欧美在线观看| 国内精品久久久久久久影视麻豆 | 欧美高清免费| 国产麻豆精品在线观看| 亚洲国产一二三| 亚洲一区二区三区精品动漫| 亚洲影音先锋| 国产精品美女久久久久久免费| 欧美一区二区三区精品| 欧美成人69av| 久久中文字幕一区二区三区| 欧美午夜www高清视频| 欧美成年人视频网站| 国产精品午夜视频| 99国产精品国产精品毛片| 亚洲国产美女精品久久久久∴| 欧美一区1区三区3区公司| 亚洲午夜精品福利| 欧美多人爱爱视频网站| 久久久免费精品视频| 国产精品久久久久久影院8一贰佰| 欧美激情视频一区二区三区在线播放| 国产日韩精品电影| 亚洲一区二区不卡免费| 亚洲视频一区在线观看| 亚洲国产另类久久精品| 一区二区三区精品久久久| 夜夜狂射影院欧美极品| 欧美黄色aa电影| 黄色亚洲精品| 久久精品国产99| 欧美在线免费观看视频| 国产精品国产自产拍高清av王其| 亚洲日本免费| 一区二区三区|亚洲午夜| 欧美成人高清视频| 亚洲国产成人91精品| 亚洲国产精品一区| 免费欧美日韩| 亚洲国产精品成人精品| 亚洲精品精选| 欧美日韩大片| 99精品热6080yy久久 | 亚洲精品在线视频| 亚洲激情图片小说视频| 欧美极品色图| 亚洲日本aⅴ片在线观看香蕉| 亚洲人成毛片在线播放| 欧美连裤袜在线视频| 亚洲精品日韩一| 亚洲欧美韩国| 国产日韩视频一区二区三区| 久久爱www久久做| 欧美成人精品影院| 亚洲理论电影网| 欧美三级在线视频| 亚洲欧美在线网| 久久一区激情| 日韩午夜电影在线观看| 欧美亚洲第一页| 欧美一区二区三区免费在线看| 另类av一区二区| 99视频精品全国免费| 国产精品久久综合| 久久久久青草大香线综合精品| 亚洲激情综合| 欧美自拍偷拍| 亚洲美女一区| 国际精品欧美精品| 欧美精品xxxxbbbb| 性做久久久久久免费观看欧美| 欧美激情视频一区二区三区不卡| 亚洲欧美国产毛片在线| 亚洲激情亚洲| 免费美女久久99| 久久成人羞羞网站| 亚洲高清123| 欧美日韩在线免费| 亚洲男同1069视频| 亚洲无限av看| 国产日产欧美一区| 欧美成人乱码一区二区三区| 久久久99国产精品免费| 亚洲高清中文字幕| 亚洲肉体裸体xxxx137| 欧美日韩一区二区三区| 亚洲欧美在线播放| 久久视频这里只有精品| 亚洲深夜福利| 久久久精品一区二区三区| 亚洲精品国产视频| 久久手机免费观看| 亚洲国产精品一区二区第一页| 精品成人一区二区| 欧美激情精品久久久久| 欧美中文字幕在线观看| 99在线热播精品免费| 亚洲福利视频网| 蜜桃av综合| 裸体歌舞表演一区二区| 久久精品国产在热久久 | 亚洲一区二区在线观看视频| 亚洲国产小视频在线观看| 国内精品亚洲| 狠狠干综合网| 狠狠色综合日日| 欧美激情视频一区二区三区不卡| 亚洲一区国产| 亚洲视频欧美视频| 日韩午夜在线| 一区二区三区成人| 一本久道久久综合狠狠爱| 亚洲大片av| 亚洲日本va在线观看| 亚洲黄色免费电影| 欧美高清在线精品一区| 欧美成人免费网| 亚洲欧洲精品天堂一级| 亚洲开发第一视频在线播放| 亚洲欧洲精品成人久久奇米网| 亚洲三级影院| 一本色道**综合亚洲精品蜜桃冫| 一本色道久久加勒比88综合| 一本大道av伊人久久综合| 亚洲特级毛片| 欧美一区二区三区免费观看| 久久精品国产亚洲aⅴ| 美女图片一区二区| 欧美精品综合| 国产乱码精品一区二区三区不卡 | 久久在线视频| 欧美国产综合视频| 国产精品www网站| 国产日韩在线一区二区三区| 永久久久久久| 中文亚洲免费| 久久黄色级2电影| 欧美不卡视频一区发布| 亚洲精品日韩在线| 欧美一级片久久久久久久| 久久综合狠狠综合久久综青草| 欧美激情导航| 国产片一区二区| 亚洲欧洲一区二区在线观看| 亚洲午夜精品视频| 久久资源在线| 一级成人国产| 久久中文字幕导航| 欧美四级在线观看| 一色屋精品视频免费看| 国产精品99久久久久久久女警| 久久精品99国产精品酒店日本| 亚洲国产精品一区制服丝袜| 亚洲欧美日韩精品久久久久| 欧美高清在线视频观看不卡| 国产精品亚洲不卡a| 亚洲日韩成人| 久久久高清一区二区三区| 亚洲美女在线视频| 久久久久久亚洲精品不卡4k岛国| 欧美日韩一区精品| 亚洲第一精品久久忘忧草社区| 亚洲欧美中文字幕| 亚洲激情一区| 老司机成人网| 好吊一区二区三区| 午夜在线a亚洲v天堂网2018| 亚洲精品乱码久久久久久按摩观|