TW202520699A - 浮水印添加及浮水印鑒別方法、電子設備及電腦可讀儲存媒體 - Google Patents
浮水印添加及浮水印鑒別方法、電子設備及電腦可讀儲存媒體 Download PDFInfo
- Publication number
- TW202520699A TW202520699A TW113143075A TW113143075A TW202520699A TW 202520699 A TW202520699 A TW 202520699A TW 113143075 A TW113143075 A TW 113143075A TW 113143075 A TW113143075 A TW 113143075A TW 202520699 A TW202520699 A TW 202520699A
- Authority
- TW
- Taiwan
- Prior art keywords
- information
- multimedia content
- current
- watermark
- model
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/098—Distributed learning, e.g. federated learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32149—Methods relating to embedding, encoding, decoding, detection or retrieval operations
- H04N1/32154—Transform domain methods
- H04N1/32165—Transform domain methods using cosine transforms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32149—Methods relating to embedding, encoding, decoding, detection or retrieval operations
- H04N1/32288—Multiple embedding, e.g. cocktail embedding, or redundant embedding, e.g. repeating the additional information at a plurality of locations in the image
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32352—Controlling detectability or arrangements to facilitate detection or retrieval of the embedded information, e.g. using markers
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本申請實施例提供了一種浮水印添加及浮水印鑒別方法、電子設備及電腦可讀儲存媒體;其中,方法包括:獲取待處理資訊;將待處理資訊輸入至第一生成模型中,得到第一多媒體內容;第一多媒體內容包含預設浮水印資訊;其中,第一生成模型與鑒別模型是聯合訓練得到的;鑒別模型用於鑒別多媒體內容是否為第一生成模型生成。
Description
本申請涉及影像處理領域,涉及但不限於浮水印添加及浮水印鑒別方法、電子設備及電腦可讀儲存媒體。
目前,利用人工智慧內容生成模型(AI Generated Content,AIGC)發展迅速,AIGC模型可用於:文本生圖,文本生視頻,文本生三維內容等。通常,將文本資訊輸入至AIGC模型中,AIGC模型就可以根據文本資訊來生成相應的圖像,視頻,三維內容等。然而,AIGC模型生成的作品由於沒有浮水印資訊,可以被任意複製和修改等,不利於對AIGC模型生成的作品進行版權管理,進而不易區分原創作品和AIGC模型生成的作品,使得AIGC模型生成的作品被大量濫用,不利於保護原創作品。
本申請提供的浮水印添加及浮水印鑒別方法、電子設備及電腦可讀儲存媒體,能夠使得浮水印資訊不易被篡改,能夠提高對AIGC模型生成的作品的管理,從而可以防止AIGC模型生成的作品被大量濫用,更好地保護原創作品。
本申請的技術方案是這樣實現的:第一方面,本申請實施例提供一種浮水印添加方法,包括:獲取待處理資訊;將待處理資訊輸入至第一生成模型中,得到第一多媒體內容;第一多媒體內容包含預設浮水印資訊;其中,第一生成模型與鑒別模型是聯合訓練得到的;鑒別模型用於鑒別多媒體內容是否為第一生成模型生成。
第二方面,本申請實施例提供一種浮水印添加方法,包括:獲取待處理資訊;將待處理資訊輸入至第一生成模型中,得到第一多媒體內容;第一多媒體內容包含預設浮水印資訊;其中,第一生成模型是基於包含浮水印資訊的多媒體內容訓練得到的。
協力廠商面,本申請實施例提供一種浮水印添加方法,包括:獲取待處理資訊和用於描述第二生成模型的描述資訊;將待處理資訊輸入至第二生成模型中,得到第二多媒體內容;對描述資訊進行編碼處理,得到浮水印資訊;將浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容。
第四方面,本申請實施例提供一種浮水印鑒別方法,包括:獲取待檢測多媒體內容;將待檢測多媒體內容輸入鑒別模型,得到浮水印鑒別結果;浮水印鑒別結果表徵待檢測多媒體內容是否為第一生成模型生成的;其中,鑒別模型是將當前多媒體內容作為正樣本進行訓練得到的;當前多媒體內容為當前原始生成模型根據文本資訊生成的;訓練完成後的當前原始生成模型為第一生成模型;第一生成模型用於生成包含浮水印資訊的多媒體內容。
第五方面,本申請實施例提供一種浮水印添加裝置,裝置包括:第一獲取單元,用於獲取待處理資訊;第一生成單元,用於將待處理資訊輸入至第一生成模型中,得到第一多媒體內容;第一多媒體內容包含預設浮水印資訊;其中,第一生成模型與鑒別模型是聯合訓練得到的;鑒別模型用於鑒別多媒體內容是否為第一生成模型生成。
第六方面,本申請實施例提供一種浮水印添加裝置,裝置包括:第二獲取單元,用於獲取待處理資訊;第二生成單元,用於將待處理資訊輸入至第一生成模型中,得到第一多媒體內容;第一多媒體內容包含預設浮水印資訊;其中,第一生成模型是基於包含浮水印資訊的多媒體內容訓練得到的。
第七方面,本申請實施例提供一種浮水印添加裝置,裝置包括:第三獲取單元,用於獲取待處理資訊和用於描述第二生成模型的描述資訊;第三生成單元,用於將待處理資訊輸入至第二生成模型中,得到第二多媒體內容;編碼單元,用於對描述資訊進行編碼處理,得到浮水印資訊;嵌入單元,用於將浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容。
第八方面,本申請實施例提供一種浮水印鑒別裝置,裝置包括:第四獲取單元,用於獲取待檢測多媒體內容;鑒別單元,用於將待檢測多媒體內容輸入鑒別模型,得到浮水印鑒別結果;浮水印鑒別結果表徵待檢測多媒體內容是否為第一生成模型生成的;其中,鑒別模型是將當前多媒體內容作為正樣本進行訓練得到的;當前多媒體內容為當前原始生成模型根據文本資訊生成的;訓練完成後的當前原始生成模型為第一生成模型;第一生成模型用於生成包含浮水印資訊的多媒體內容。
第九方面,本申請實施例提供一種電子設備,包括:記憶體,用於儲存可執行指令;處理器,用於執行記憶體中儲存的可執行指令時,實現上的浮水印添加方法或者浮水印鑒別方法。
第十方面,本申請實施例提供一種電腦可讀儲存媒體,儲存媒體儲存有可執行指令,當可執行指令被執行時,用於引起處理器執行如上的浮水印添加方法或者浮水印鑒別方法。
在本申請實施例中,提供了一種浮水印添加及浮水印鑒別方法、電子設備及電腦可讀儲存媒體,方法包括:首先,獲取待處理資訊;然後,將待處理資訊輸入至第一生成模型中,得到第一多媒體內容;第一多媒體內容包含預設浮水印資訊。一方面,將待處理資訊輸入至第一生成模型中,通過第一生成模型的處理即可獲得帶有預設浮水印資訊的第一多媒體內容,通過第一生成模型可以使得第一多媒體內容帶有不易被任意複製和修改的浮水印資訊,故而,能夠提高對AIGC模型生成的作品的管理。再一方面,由於第一生成模型與鑒別模型是聯合訓練得到的;且鑒別模型用於鑒別多媒體內容是否為第一生成模型生成,通過生成模型和鑒別模型的聯合訓練能夠使得第一生成模型學習浮水印資訊的相關特徵,從而可以更好地生成帶有浮水印資訊的第一多媒體資料,相對於顯示浮水印添加方式,本申請實施例中的第一生成模型生成的第一多媒體內容中的浮水印資訊不易被任意複製和修改,從而可以防止AIGC模型生成的作品被大量濫用,更好地保護原創作品。
應當理解的是,以上的一般描述和後文的細節描述僅是示例性和解釋性的,並不能限制本申請。
為了使本申請的目的、技術方案和優點更加清楚,下面將結合附圖對本申請作進一步地詳細描述,所描述的實施例不應視為對本申請的限制,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其它實施例,都屬於本申請保護的範圍。
為使本申請實施例的目的、技術方案和優點更加清楚,下面將結合本申請實施例中的附圖,對本申請的具體技術方案做進一步詳細描述。以下實施例用於說明本申請,但不用來限制本申請的範圍。
除非另有定義,本申請所使用的所有的技術和科學術語與屬於本申請的技術領域的技術人員通常理解的含義相同。本申請中所使用的術語只是為了描述本申請實施例的目的,不是旨在限制本申請。
在以下的描述中,涉及到“一些實施例”、“本實施例”、“本申請實施例”以及舉例等等,其描述了所有可能實施例的子集,但是可以理解,“一些實施例”可以是所有可能實施例的相同子集或不同子集,並且可以在不衝突的情況下相互結合。
AIGC(AI Generated Content,是指利用人工智慧技術來生成內容)是目前較為流行的領域。AIGC包括:文本生圖,文本生視頻,文本生3D內容等。具體來說,將一段文本輸入至AI(人工智慧)模型中,AI模型就可以根據輸入的文本內容來生成相應的圖像,視頻,3D內容等。這樣的AI技術大大提升了藝術創作的便捷性,但也會導致大量無版權的AI任意生成作品。
相關技術中,通常可以在AI模型生成作品後,為該作品添加顯示浮水印(比如在作品角落或下方標注出作品由什麼公司的AI模型生成)。但顯示浮水印有兩個缺點:(1)影響作品美觀;(2)使用者容易發現圖像有浮水印,從而去直接修改浮水印部分。浮水印用於體現該作品的版權資訊,也即該作為某個AI模型生成,如此,在該作品被複製、修改等未被授權的使用時,可以及時被發現。然而,由於生成作品和添加浮水印是通過兩個步驟實現的,如果該AI模型被未授權使用,該AI模型生成作品還可以後期添加其他浮水印,則無法確認是否為該AI模型生成,對AI模型本身的版權保護不利。
本申請實施例提出了一種給AI生成的藝術作品加入浮水印的方法(即浮水印添加方法),使得AI模型生成的作品中自帶浮水印,實現對AI模型生成作品的版權的保護,減少作品中浮水印被任意複製和修改的可能性,從而提高了浮水印安全性。本申請實施例提供的浮水印添加方法被浮水印添加裝置和電子設備執行,其中,浮水印添加裝置可作為軟體功能模型的形式儲存在電子設備中也可以作為硬體功能模組集成在電子設備中,浮水印添加裝置也可以與電子設備進行軟體和硬體的結合,以實現浮水印添加方法,本申請對此不作任何限定。
在本申請實施例中,電子設備可以為伺服器,該伺服器可以是獨立的物理伺服器,也可以是多個物理伺服器構成的伺服器集群或者分散式系統,還可以是提供雲服務、雲資料庫、雲計算、雲函數、雲儲存、網路服務、雲通信、中介軟體服務、功能變數名稱服務、安全服務、CDN、以及大資料和人工智慧平臺等基礎雲計算服務的雲伺服器,本申請實施例對此不作限定。
另外,電子設備可以為終端設備,該終端設備可以是行動電話、平板個人電腦(tablet personal computer,TPC)、媒體播放機、智慧電視、筆記型電腦(laptop computer,LC)、個人數位助理(personal digital assistant,PDA)、個人電腦(personal computer,PC)、照相機、攝像機、智慧手錶、可穿戴式設備(wearable device,WD)或者自動駕駛的車輛等,本申請實施例對此不作限定。
本申請實施例提供了一種浮水印添加方法,該方法的基本思想是:首先,獲取待處理資訊;然後,電子設備將待處理資訊輸入至第一生成模型中,得到第一多媒體內容;第一多媒體內容包含預設浮水印資訊。一方面,本申請實施例將待處理資訊資訊輸入至第一生成模型中,即可直接得到包含預設浮水印資訊的第一多媒體內容,提高了添加浮水印的效率。由於第一多媒體內容是第一生成模型生成的,其包含的預設浮水印資訊不易被修改,從而增加了浮水印的安全性,提高了第一生成模型生成第一多媒體內容的保護效果。另一方面,本申請實施例中第一生成模型與鑒別模型是聯合訓練得到的,且鑒別模型用於鑒別多媒體內容是否為第一生成模型生成的。因此,在對第一生成模型和鑒別模型同時進行訓練的過程中,可以更好地學習到預設浮水印資訊的特徵,提高第一生成模型生成第一多媒體內容的效果。
下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述。
圖1為本申請實施例提供的一種可選的浮水印添加方法的流程示意圖一,該方法是利用AI模型為生成的作品自動添加浮水印的方法一,如圖1所示,該方法可以包括:S101至S102。
S101、獲取待處理資訊。
在本申請實施例中,待處理資訊為文本、圖像、音訊和三維模型中的任意一種,本申請實施例對待處理資訊的類型不作任何限定。
在本申請實施例中,電子設備可以從文本資訊中提取待處理資訊,也可以對其他多媒體資訊進行文本轉換得到待處理資訊。其中,其他多媒體資訊可以為音訊資訊,也可以為視頻資訊,本申請實施例對此不作限制。
在本申請實施例中,從文本資訊中提取待處理資訊的獲取途徑有多種,比如:從資料集中獲取文本資訊,如自然語言處理領域中的常用資料集、評論資料集等;使用者輸入,如搜尋引擎中使用者輸入的關鍵字、社交媒體上使用者發佈的資訊等;軟體日誌、系統日誌等內部資料來源;專業資料庫,如各種知識庫、文獻資料庫等,本申請實施例對此不作任何限制。
本申請中涉及的獲取的各種待處理資訊及其相關資訊均在取得授權許可的前提下獲取。
S102、將待處理資訊輸入至第一生成模型中,得到第一多媒體內容;第一多媒體內容包含預設浮水印資訊;其中,第一生成模型與鑒別模型是聯合訓練得到的;鑒別模型用於鑒別多媒體內容是否為第一生成模型生成。
在本申請實施例中,電子設備在獲取到待處理資訊之後,可以將待處理資訊輸入至第一生成模型中,得到包含預設浮水印資訊的第一多媒體內容。第一多媒體內容可以包括圖像、模型和視頻等,本申請實施例對此不作限制。
在本申請實施例中,預設浮水印資訊用於表徵第一生成模型的描述資訊,例如,模型的版本資訊、模型的創建時間資訊、模型的名稱等等,本申請實施例對此不作限制。
在本申請實施例中,預設浮水印資訊可以為文本資訊,也可以為編碼資訊,還可以為色彩資訊等可以通過編碼表示的資訊。預設浮水印資訊可以在第一多媒體內容中作為顯示浮水印體現,也可以作為隱式浮水印體現。對此,可以根據需要設置,本申請實施例不作限制。
在本申請實施例中,預設浮水印資訊可以隱藏在第一多媒體內容的內容資訊中。第一多媒體內容的內容資訊可以包括圖元資訊、密度資訊、顏色資訊、色彩資訊等,本申請實施例對此不作限制。示例性的,第一多媒體內容為圖像,內容資訊為圖元資訊,預設浮水印資訊可以隱藏在圖像的圖元資訊中。
在本申請實施例中,顯示浮水印的添加方式為直接添加,即將預設浮水印資訊直接添加在多媒體內容上,使用者看到多媒體內容時,可以直接看到顯示浮水印。隱式浮水印的添加方式可以包括:修改頻譜圖演算法,即將第二多媒體內容的頻譜圖與預設浮水印資訊的頻譜圖進行疊加的方法;也可以為圖像隱寫術演算法,即通過多媒體內容的圖元資訊或者色彩分佈來隱藏預設浮水印資訊的方法。如此,可以使得包含浮水印資訊的第一多媒體內容在視覺上不會明顯的體現圖像的顏色或者亮度等資訊的變化。其中,圖像隱寫術演算法包括以下至少一種:LSB(Least Significant Bit,最低有效位元)隱寫演算法、DCT(Discrete Cosine Transform,離散余弦變換濾波演算法)隱寫演算法、F5演算法;對此,本申請實施例不作限制。
需要說明的是,LSB隱寫演算法是將要隱藏的資訊編碼到圖元的最低有效位元,對原始圖像的影響較小;DCT隱寫演算法是在圖像的DCT係數中嵌入資訊,資訊容量較大;F5演算法是在LSB隱寫演算法的基礎上引入雜湊函數,可以增加隱寫資訊的安全性和穩定性。
在本申請實施例中,第一生成模型可以為生成對抗網路模型(Generative Adversarial Networks,GAN)、變分自編碼器(Variational Autoencoder,VAE)、卷積神經網路(Convolutional Neural Network,CNN)、擴散模型(Diffusion Model)等等,本申請實施例對此不作限制。
在本申請實施例中,第一生成模型與鑒別模型是聯合訓練得到的。鑒別模型用於鑒別多媒體內容是否為第一生成模型生成。如此,在訓練過程中,第一生成模型不僅可以通過真值多媒體內容學習如何給多媒體內容添加浮水印,還可以通過鑒別模型的輸出結果學習如何給多媒體內容添加浮水印,提高第一多媒體內容中預設浮水印資訊的效果。
需要說明的是,第一生成模型與鑒別模型是聯合訓練得到,意味著第一生成模型與鑒別模型是作為一個整體網路模型同時進行訓練得到的,兩者的訓練過程並不是相互割裂的,而是相互影響的。
其中,真值多媒體內容為第一生成模型在訓練過程中,基於待處理資訊生成的多媒體內容的目標,訓練中的第一生成模型生成的多媒體內容與真值多媒體內容之間的差值越小,表示該訓練中的第一生成模型越趨近於訓練好的第一生成模型。
在本申請實施例中,真值多媒體內容可以是包含預設浮水印資訊的多媒體內容,也可以是不包含預設浮水印資訊的多媒體內容。其中,不包含預設浮水印資訊的真值多媒體內容可以是由第二生成模型根據文本資訊產生的,也可以是多媒體資料庫中獲取的;包含預設浮水印資訊的真值多媒體內容可以是多媒體資料庫中獲取的,也可以是在第二生成模型產生的多媒體內容上添加預設浮水印資訊得到的;本申請實施例對此不作限制。
在本申請實施例中,第二生成模型可以為生成對抗網路模型(Generative Adversarial Networks,GAN)、變分自編碼器(Variational Auto Encoder,VAE)、卷積神經網路(Convolutional Neural Network,CNN)、擴散模型(Diffusion Model)等等。這裡,第二生成模型可以與第一生成模型的模型類別相同,也可以不同;本申請實施例對此不作限制。
在本申請實施例中,首先,獲取待處理資訊;然後,將待處理資訊輸入至第一生成模型中,得到第一多媒體內容;第一多媒體內容包含預設浮水印資訊。一方面,將待處理資訊輸入至第一生成模型中,通過一次處理即可獲得帶有預設浮水印資訊的第一多媒體內容,相比于為利用文本資訊一次處理得到的原始多媒體資料之後再添加浮水印資訊的方法,本申請實施例能夠提高浮水印資訊添加的簡單性和快捷性。再一方面,由於第一生成模型與鑒別模型是聯合訓練得到的;且鑒別模型用於鑒別多媒體內容是否為第一生成模型生成,通過生成模型和鑒別模型的聯合訓練能夠使得第一生成模型學習浮水印資訊的相關特徵,從而可以更好地生成帶有浮水印資訊的第一多媒體資料,相對於顯示浮水印添加方式,本申請實施例中的第一生成模型生成的第一多媒體內容中的浮水印資訊不易被篡改,能夠提高對AIGC模型生成的作品的管理,從而防止AIGC模型生成的作品被大量濫用,更好地保護原創作品。
在本申請的一些實施例中,基於圖1,如圖2所示,在S102中將待處理資訊輸入至第一生成模型中,得到第一多媒體內容之前的實現,可以包括:S103至S106。
S103、將文本資訊輸入至當前原始生成模型,得到當前多媒體內容。
在本申請實施例中,電子設備可以利用文本資訊分次對原始生成模型進行訓練,將上一次訓練得到的模型作為當前原始生成模型。這裡,電子設備將文本資訊輸入至當前原始生成模型,可以得到當前多媒體內容。每次輸入的文本資訊可以包括一個,也可以包括多個。本申請實施例對此不作限定。
在本申請實施例中,當前原始生成模型指的是在訓練過程中的生成模型,即訓練完成前的第一生成模型。第一生成模型則是指最終訓練好的生成模型。在最終的浮水印鑒別或者浮水印生成中使用的是第一生成模型。當前原始生成模型和第一生成模型的模型結構雖然相同,但是兩者的模型參數是不同的,在訓練的過程中,在滿足一定的條件的情況下,對當前原始生成模型進行更新,從而得到更新後的生成模型,直至滿足預設條件為止,則停止訓練,將此時的當前原始生成模型作為最終的第一生成模型。
S104、將當前多媒體內容與對應的真值多媒體內容之間的內容差值,確定為當前生成損失。
在本申請實施例中,內容差值用於表徵當前多媒體內容的內容資訊與真值多媒體內容的內容資訊之間的差值。例如,當多媒體內容為圖像時,內容資訊可以為圖元值,內容差值則可以為當前圖像與對應的真值圖像之間的圖元差值。
在本申請的一些實施例中,真值多媒體內容不包含預設浮水印資訊,此時鑒別模型的正樣本可以包含預設浮水印資訊。由於第一生成模型與鑒別模型是聯合訓練的,鑒別模型可以將鑒別結果回饋給當前原始生成模型,且鑒別結果包含對正樣本和負樣本的鑒別資訊,使得當前原始生成模型可以通過鑒別結果學習到如何給多媒體內容添加浮水印資訊,從而是第一生成模型能夠生成包含預設浮水印資訊的第一多媒體內容。
在本申請的一些實施例中,真值多媒體內容為帶有浮水印資訊的真值圖像。當前原始生成模型可以通過真值多媒體內容學習如何給多媒體內容添加浮水印資訊,使得最終得到的第一生成模型可以生成帶有預設浮水印資訊的第一多媒體內容。
需要說明的是,每次訓練時,輸入當前原始生成模型的文本資訊可以包括多個,當前原始生成模型生成的當前多媒體內容則可以包括多個多媒體內容,電子設備可以先確定每個多媒體內容與對應的真值多媒體內容之間的內容差值,得到多個內容差值,再根據多個內容差值確定當前生成損失。這裡,電子設備可以將多個內容差值的總和作為當前生成損失,也可以將多個內容差值的平均值作為當前生成損失,對此,本申請實施例不作限制。
在本申請實施例中,真值多媒體內容可以為模型生成的,也可以為預設多媒體庫中獲取的;對此,本申請實施例不作限制。
S105、將當前多媒體內容作為正樣本,與負樣本一起輸入當前鑒別模型,得到鑒別損失;負樣本為非第一生成模型生成的多媒體內容。
在本申請實施例中,電子設備可以通過每一次訓練得到的當前多媒體圖像作為對應的一次訓練鑒別模型的正樣本,和負樣本一起對鑒別模型依次進行訓練,得到每一次的當前鑒別模型。其中,負樣本為非第一生成模型生成的其他多媒體內容。例如,負樣本可以為其他生成模型(非第一生成模型)生成的多媒體內容,也可以為非模型生成的多媒體內容。
在本申請的一些實施例中,S105中將當前多媒體內容作為正樣本,與負樣本一起輸入當前鑒別模型,得到鑒別損失的實現,可以包括:S1051至S1052。
S1051、將當前多媒體內容作為正樣本,與負樣本一起輸入當前鑒別模型,得到針對正樣本的當前第一鑒別結果和針對負樣本的當前第二鑒別結果。
在本申請實施例中,當前第一鑒別結果用於表徵當前鑒別模型判斷的正樣本是否為第一生成模型生成的;當前第二鑒別結果用於表徵當前鑒別模型判斷負樣本是否為第一生成模型生成的。
S1052、根據當前第一鑒別結果和當前第二鑒別結果確定當前鑒別損失。
在本申請實施例中,電子設備可以根據當前第一鑒別結果和對應的當前第一鑒別標籤,確定當前第一鑒別損失;根據當前第二鑒別結果和對應的當前第二鑒別標籤,確定當前第二鑒別損失;根據當前第一鑒別損失和當前第二鑒別損失,確定當前鑒別損失。
在本申請實施例中,當前第一鑒別標籤表徵正樣本是第一生成模型生成的,當前第二鑒別標籤表徵負樣本不是第一生成模型生成的。
在本申請實施例中,第一鑒別標籤和第二鑒別標籤可以通過概率值的方式體現,一般來說,正樣本的第一鑒別標籤對應的概率值趨近於1,負樣本的第二鑒別標籤對應的概率值趨近於0。
在本申請的一些實施例中,電子設備可以將當前第一鑒別結果與當前第一鑒別標籤輸入至二分類損失函數中,得到當前第一鑒別損失;以及,將當前第二鑒別結果與當前第二鑒別標籤輸入至二分類損失函數中,得到當前第二鑒別損失。在一些實施例中,二分類損失函數可以為BCE損失函數(Binary Cross Entropy)。
在本申請實施例中,電子設備可以將當前第一鑒別損失和當前第二鑒別損失的和作為當前鑒別損失,也可以對當前第一鑒別損失和當前第二鑒別損失進行加權求和,得到當前鑒別損失。其中,當前第一鑒別損失和當前第二鑒別損失的權值可以是預先設置好的,對此,可以根據需要設置,本申請實施例不作限制。
S106、根據當前鑒別損失和當前生成損失,更新當前原始生成模型,得到第一生成模型。
在本申請實施例中,電子設備可以根據當前鑒別損失和當前生成損失,對當前原始生成模型進行訓練,根據當前鑒別損失和當前生成損失學習添加預設浮水印資訊,更新當前原始生成模型,從而得到第一生成模型。
可以理解的是,聯合當前鑒別損失和當前生成損失更新生成模型,可以提高第一生成模型生成第一多媒體內容時,攜帶預設浮水印資訊準確性。同時,當前原始鑒別模型在訓練停止後得到鑒別模型,可以用來鑒別多媒體內容是否為第一生成模型生成。
在本申請的一些實施例中,S106中根據當前鑒別損失和當前生成損失,更新當前原始生成模型,得到第一生成模型的實現,可以包括:S1061至S1062。
S1061、根據當前鑒別損失和當前生成損失,確定當前目標生成損失。
在本申請實施例中,電子設備在確定當前鑒別損失和當前生成損失之後,可以根據當前鑒別損失和當前生成損失一起確定當前目標生成損失。在一些實施例中,電子設備可以將當前鑒別損失和當前生成損失的平均值作為當前目標損失。在一些實施例中,電子設備可以對當前鑒別損失和當前生成損失進行加權求和,得到當前目標生成損失。
在本申請實施例中,當前鑒別損失和當前生成損失的權值為預先設定好的,權值可以表徵損失的重要程度,重要程度越高,對當前原始生成模型的更新的影響越大。示例性的,當前鑒別損失的權值與當前生成損失的權值相同時,表徵當前鑒別損失的重要程度與當前生成損失的重要程度相同。
S1062、在當前目標生成損失小於或者等於目標生成損失閾值,或者當前生成更新次數大於或者等於最大生成次數的情況下,將當前原始生成模型作為第一生成模型。
在本申請實施例中,模型訓練的截止條件可以包括:當前目標生成損失是否小於或等於目標生成損失閾值,和/或當前生成更新次數是否大於最大生成次數。其中,當前生成更新次數表徵當前原始生成模型的訓練次數。最大生成次數和目標生成損失閾值可以根據需要設置,對此本申請實施例不作限制。
可以理解的是,利用當前鑒別損失和當前生成損失進行聯合訓練,可以提高生成模型的準確度,從而提高第一生成模型生成帶有浮水印資訊的多媒體資料的準確性。
在本申請的一些實施例中,S1061中根據當前鑒別損失和當前生成損失,確定當前目標生成損失之後,電子設備可以在當前目標生成損失大於目標生成損失閾值的情況下,根據當前目標生成損失更新當前原始生成模型,得到更新後的原始生成模型。
在本申請實施例中,電子設備在得到當前目標生成損失之後,需要判斷當前生成損失是否大於目標生成損失閾值,如果是,則需要根據當前目標生成損失更新當前原始生成模型,得到更新後的原始生成模型,否則需要停止訓練。
示例性的,圖3為本申請實施例提供的一種可選的模型訓練過程的流程示意圖一,如圖3所示,電子設備在對第一生成模型和鑒別模型的當前次訓練過程中,可以將文本資訊輸入至當前原始生成模型中,得到當前多媒體內容;然後,將當前多媒體內容和對應的真值多媒體內容之間的內容差值,作為當前生成損失。以及,電子設備可以將當前多媒體內容作為正樣本,和負樣本共同輸入至當前鑒別模型中,得到正樣本的當前第一鑒別結果和負樣本的當前第二鑒別結果;隨後,將當前第一鑒別結果與其對應的當前第一鑒別標籤之間的差值,作為當前第一鑒別損失,將當前第二鑒別結果與其對應的當前第二鑒別標籤之間的差值,作為當前第二鑒別損失;再將當前第一鑒別損失和當前第二鑒別損失的加權和,得到當前鑒別損失。最後,電子設備可以將當前生成損失和當前鑒別損失的加權和,作為當前目標生成損失;根據當前目標生成損失,對當前原始生成模型進行反覆運算訓練,得到第一生成模型,同時,根據當前鑒別損失,對當前鑒別模型進行反覆運算訓練,得到鑒別模型。
在本申請的一些實施例中,真值多媒體內容可以為帶有預設浮水印資訊的多媒體內容,基於圖2,如圖4所示,S104中將當前多媒體內容與對應的真值多媒體內容之間的內容差值,確定為當前生成損失之前的實現,可以包括:S107至S108。
S107、將文本資訊輸入至第二生成模型中,得到第二多媒體內容。
在本申請實施例中,電子設備將文本資訊輸入至第二生成模型中,得到文本資訊對應的第二多媒體內容。這裡,第二多媒體內容不包含浮水印資訊。第二多媒體內容包括以下至少一種:圖像、視頻、3D模型。
S108、將預設浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容。
在本申請實施例中,電子設備在得到不帶浮水印資訊的第二多媒體內容之後,可以將預設浮水印資訊嵌入至第二多媒體內容中,得到真值多媒體內容。真值多媒體內容中則帶有預設浮水印資訊,預設浮水印資訊可以體現為顯示浮水印,也可以體現為隱式浮水印。
可以理解的是,將預設浮水印資訊嵌入到AI模型(第二生成模型)生成的第二多媒體內容中,可以得到帶有預設浮水印資訊的真值多媒體內容,通過真值多媒體內容訓練第一生成模型可以提高模型訓練效率,由於生成的第一多媒體內容包含預設浮水印資訊,可以提高第一生成模型生成第一多媒體內容的版權的安全性。
在本申請的一些實施例中,S108中將預設浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容之前的實現,可以包括:S1081至S1082。
S1081、獲取用於描述第一生成模型的描述資訊。
在本申請實施例中,第一生成模型的描述資訊可以包括以下至少一種:版本資訊、創建時間資訊、名稱、創建作者資訊等可以體現第一生成模型的版權的資訊。
示例性的,描述資訊可以為:“stable diffusion 1.5, 03/22/2023,XXX”,包括第一生成模型的版本資訊“stable diffusion 1.5”、創建時間資訊“03/22/2023”以及創建作者資訊“XXX”。
S1082、將描述資訊進行編碼,得到預設浮水印資訊。
在本申請實施例中,電子設備在獲取描述資訊之後,可以按照預設編碼方式,將描述資訊進行編碼,得到預設浮水印資訊。
在本申請的一些實施例中,電子設備可以通過預設編碼器對描述資訊進行編碼,預設編碼器編碼的方法可以包括:哈夫曼編碼、等分編碼、同位編碼和查分編碼等;對此,可以根據需要設置,本申請實施例不作限制。通過預設編碼器編碼簡單快捷,效率高。
在本申請的一些實施例中,電子設備可以通過AI模型對描述資訊進行編碼。其中,AI模型的編碼方式是用深度學習模型對文本進行編碼,從而得到文本的向量表示。利用AI模型編碼可以充分利用上下文資訊,得到較好的文本表示。
示例性的,將描述資訊進行編碼,得到浮水印資訊的過程可以表示為:f(“stable diffusion 1.5,03/22/2023,XXX”)= “00010010001101001000100110111111”,其中,f表示編碼器或者AI模型。
在本申請的一些實施例中,S108中將預設浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容的實現,可以包括:S201至S204。
S201、將預設浮水印資訊進行頻域轉換,得到第一頻域的頻域浮水印資訊。
S202、對第二多媒體內容進行頻域轉換,得到第二頻域的頻域多媒體內容。
在本申請實施例中,電子設備可以通過第一預設頻譜轉換方式,將預設浮水印資訊進行頻域轉換(也稱為頻域變化、頻譜轉換等),得到頻域浮水印資訊。電子設備可以通過第二預設頻譜轉換方式,將第二多媒體內容進行頻域轉換,得到頻域多媒體內容。
其中,預設頻譜轉換方式可以包括:傅裡葉變換(Fourier Transform,FT)、離散傅裡葉變換(Discrete Fourier Transform,DFT)、快速傅裡葉變換(Fast Fourier Transform,FFT)、小波變換(Wavelet Transform)和離散餘弦變換(Discrete Cosine Transform,DCT)等。本申請實施例對此不做限制。
在本申請實施例中,第二多媒體內容轉換值頻域為低頻頻域,也即第二頻域;電子設備可以將預設浮水印資訊轉換到高頻頻域,也即第一頻域,使預設浮水印資訊所在的頻域與第二多媒體內容所在的頻域區分開來。其中,高頻頻域的頻域範圍可以根據需要設置,本申請實施例不作限制。
S203、將頻域浮水印資訊與頻域多媒體內容進行頻域疊加,得到頻域真值多媒體內容。
在本申請實施例中,電子設備可以將高頻頻域的頻域浮水印資訊和低頻頻域的頻域多媒體內容進行頻域疊加,得到頻域真值多媒體內容;頻域真值多媒體內容的高頻分量為頻域浮水印資訊。
S204、對頻域真值多媒體內容進行時域轉換,得到真值多媒體內容。
在本申請實施例中,電子設備在得到頻域真值多媒體內容後,將頻域真值多媒體內容轉換回時域,就可以得到真值多媒體內容。
在一些實施例中,電子設備可以將頻域浮水印資訊添加到第二多媒體內容的高頻分量或者高頻分量的預設頻率上,再轉換為時域,從而得到真值多媒體內容。
可以理解的是,由於頻域浮水印資訊在第一頻域,頻域多媒體內容在第二頻域,兩者在不同的頻域,電子設備可以方便地浮水印資訊嵌入到圖像的細節中,減小預設浮水印資訊對圖像的視覺品質的影響。
在本申請的一些實施例中,S108中將預設浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容的實現,可以包括:基於預設浮水印資訊,對第二多媒體內容中目標選定區域的內容資訊進行修改,得到真值多媒體內容;內容資訊包括以下至少一種:圖元資訊、亮度資訊、座標資訊、密度資訊。
在本申請實施例中,目標選定區域為第二多媒體內容中的待修改內容資訊的區域。目標選定區域可以根據需要設置,本申請實施例不作限制。
示例性的,第二多媒體內容為圖像,目標選定區域可以為圖像的一部分,例如:圖像最週邊一圈的圖元、圖像中高頻頻域對應的圖元,或者,圖像邊緣部分的圖元等。第二多媒體內容為視頻,目標選定區域可以為視頻中的特定場景。第二多媒體內容為3D模型,電子設備可以將3D模型對應的紋理貼圖的邊緣區域作為3D模型的目標選定區域,和/或,將3D模型中的特定網格頂點,和/或特定體素作為目標選定區域。
在本申請實施例中,電子設備在確定目標選定區域之後,可以將目標選定區域的內容資訊修改為預設浮水印資訊,得到真值多媒體資訊。
在本申請實施例中,內容資訊包括以下至少一種:圖元資訊、亮度資訊、座標資訊、密度資訊;其中,圖元資訊為目標選定區域中的各個圖元點的圖元值,亮度資訊為目標選定區域中的各個圖元點的亮度值,座標資訊為目標選定區域中的各個圖元點的座標值,密度資訊為目標選定區域中的各個圖元點/頂點/體素的座標值。在數位圖像、視頻或3D模型中,每個圖元或體素的圖元值通常由多個位組成,每個通道的圖元值可以表示為一個整數。
可以理解的是,只需對目標選定區域進行修改就可以將浮水印資訊嵌入至對應的藝術作品中,可以更有效地保護版權可以提高預設浮水印資訊的嵌入效率。
在本申請的一些實施例中,目標選定區域的內容資訊包括預設數量個內容資訊;預設數量與浮水印資訊的位元數相同;S1080中基於預設浮水印資訊,對第二多媒體內容中目標選定區域的內容資訊進行修改,得到真值多媒體內容的實現,可以包括:將第二多媒體內容中預設數量個內容資訊中每個內容資訊的最低有效位元修改為對應的一位元浮水印資訊,得到真值多媒體內容。其中,目標選定區域中內容資訊的數量大於等於浮水印資訊的位元數。
當目標選定區域所包含的內容資訊的數量大於浮水印資訊的位元數時,只需要在目標選定區域所包含的內容資訊中選取與浮水印資訊的位元數相同數量的內容資訊進行嵌入即可。
示例性的,浮水印資訊為“0110111”,該浮水印資訊的位元數為7,則目標選定區域的內容資訊包括7個內容資訊。目標選定區域所包含的內容資訊的數量大於等於浮水印資訊的位元數,這樣,才能將浮水印資訊嵌入至目標選定區域的內容資訊中。
在本申請的一些實施例中,目標選定區域包含的內容資訊的數量等於浮水印資訊的位元數。電子設備可以按照預設內容順序,對目標選定區域中內容資訊進行修改,將每個內容資訊修改為浮水印資訊中對應的一位元。在一些實施例中,電子設備可以將浮水印資訊按照從最低位元到最高位元的順序,依次修改至目標選定區域,也可以按照從最高位元到最低位元的順序,依次修改至目標選定區域,還可以按照其他預設選定順序,依次修改至目標選定區域,對此,本申請實施例不作限制。
示例性的,內容資訊為圖元資訊;浮水印資訊為“101”包括3個編碼位元,也即浮水印資訊的位元數為3,目標選定區域包含3個圖元資訊。電子設備可以按照從最低位元到最高位元的預設選定順序,將浮水印資訊的第1個編碼位元“1”修改至目標選定區域中第1個圖元的LSB,將浮水印資訊的第2個編碼位元“0”修改至目標選定區域中第2個圖元的LSB,將浮水印資訊的第3個編碼位元“1”修改至目標選定區域中第3個圖元的LSB,得到真值多媒體內容。在一些實施例中,電子設備可以同時對3個圖元的LSB進行修改,也可以從第1個圖元的LSB開始,依次進行修改,直到完成3個圖元的修改,實現LSB隱寫。由於浮水印資訊被插入到圖像圖元的LSB。而LSB是圖像圖元值中最不顯著的位元,插入的浮水印資訊對圖像的視覺效果影響很小,甚至不可見。在解碼的時候,可以使用相應的解碼演算法提取出嵌入的資訊,並還原原始資料,進而得到第一生成模型的描述資訊。
示例性的,假設要將一條二進位資訊"1011"中的第一位資訊"1"嵌入到一個圖元值為"11010110"的圖元中,可以將"11010110"中的LSB"0"替換為"1",得到"11010111"。在提取資訊時,只需從每個圖元的LSB中提取出資訊位元即可還原原始資料。
可以理解的是,電子設備可以在第二生成模型生成的第二多媒體內容中嵌入第一生成模型的描述資訊,這些描述資訊不容易被使用者發現,不會影響作品的美觀度,但卻可以被電腦/模型解碼。如此,可以實現對第一生成模型生成的第一多媒體內容的版權的保護,減少第一多媒體內容被未經授權地使用和傳播,提高安全性。
在本申請的一些實施例中,第二多媒體內容包括:圖像;目標選定區域包括:圖像的邊緣區域;內容資訊包括:圖元資訊。
在本申請實施例中,在第二多媒體內容為圖像的情況下,電子設備可以對第二多媒體內容進行邊緣檢測,得到圖像的邊緣區域,並將圖像的邊緣區域作為目標選定區域。
在本申請實施例中,圖像的邊緣區域對應頻譜中的高頻分量,高頻分量表示的是圖像中變化快、細節多的區域,例如圖像的邊緣、紋理和細節等資訊。
在本申請實施例中,電子設備可以對圖像進行邊緣檢測,識別出圖像中強度、顏色或紋理等變化比較顯著的位置,從而確定圖像的邊緣區域。其中,比較常見的邊緣檢測演算法包括:Sobel運算元的邊緣檢測演算法、Canny運算元的邊緣檢測演算法、Laplace算的邊緣檢測演算法子、基於小波變換的邊緣檢測演算法和基於深度學習的邊緣檢測演算法等。對此,可以根據需要設置,本申請實施例不作限制。
在本申請的一些實施例中,第二多媒體內容包括:視頻;目標選定區域包括:視頻中的預設視頻幀的邊緣區域;內容資訊包括:圖元資訊。
在本申請實施例中,預設視頻幀可以為:視頻中的第X個視頻幀、視頻中的每個幀、第x個視頻幀開始的連續m個視頻幀等,對此,可以根據需要設置,本申請實施例不作限制。電子設備在確定出預設視頻幀之後,可以對預設視頻幀的邊緣區域的圖元進行修改。這樣可以提高浮水印位置的穩定性,並且減少對視頻的品質產生的影響。
在本申請實施例中,任意一個預設視頻幀是一個圖像,預設視頻幀的邊緣區域即為圖像的邊緣區域。電子設備可以通過邊緣檢測演算法,確定圖像的邊緣區域。
在本申請實施例中,電子設備可以按照預設抽樣策略,在視頻幀中確定至少一個抽樣幀作為預設視頻幀。
在視頻中進行LSB隱寫時,為了保證浮水印的穩定性和可檢測性,需要在預設視頻幀中進行浮水印嵌入,預設視頻幀的設置需要考慮以下幾個因素。
1)、時間間隔:選擇抽樣幀時,通常情況下,相鄰的兩幀之間的時間間隔越大,那麼對於隱寫浮水印的穩定性和可檢測性的影響也越大。因此,在選擇抽樣幀時,需要儘量保證它們之間的時間間隔不超過預設的間隔閾值,預設的間隔閾值可以根據需要設置。
2)、視頻內容:視頻的內容也會影響抽樣幀的選擇。例如,對於一些動態場景,需要選擇幀率更高的抽樣幀,以便更好地捕捉視頻中的細節。另外,如果視頻中包含運動劇烈的物體,也需要選擇更多的抽樣幀,以提高浮水印的可靠性。
3)壓縮演算法:視頻通常需要進行壓縮以減小儲存空間。在選擇抽樣幀時,需要考慮壓縮演算法的影響。一些壓縮演算法可能會導致視頻中的一些細節資訊被壓縮掉,因此需要選擇更多的抽樣幀以提高浮水印的魯棒性。
4)、浮水印嵌入策略:浮水印嵌入策略也會影響抽樣幀的選擇。例如,如果採用了不同的嵌入演算法,就需要根據演算法特點選擇不同的抽樣幀。另外,如果嵌入的浮水印比較大,需要選擇更多的抽樣幀以提高浮水印的魯棒性。
示例性的,預設視頻幀的邊緣區域可以包括:預設視頻幀4個頂角對應的圖元點。根據預設浮水印資訊,對四個頂角的圖元點的圖元值進行修改,可以提高浮水印的穩定性和可檢測性。
可以理解的是,預設視頻幀的邊緣部分往往包含了一些較為平滑和穩定的區域,對於預設視頻幀的圖元的修改比較容易隱藏,而且這些區域的圖元值變化較小,也不容易引起人眼的注意。因此,電子設備對邊緣區域修改圖元可以減少對視頻品質的影響,同時可以保證浮水印的魯棒性和不可見性。此外,邊緣部分的圖元數量相對較少,只需要修改其中的一小部分圖元即可實現浮水印的嵌入,這樣可以減少嵌入過程中的計算量和時間成本。
綜上所述,可以通過對視頻進行分析,結合實際需求和嵌入策略,來確定抽樣幀的數量和位置,比如可以選擇視頻的開頭、結尾、關鍵場景等進行抽樣,以盡可能地捕捉視頻的特徵。
在本申請的一些實施例中,第二多媒體內容包括:三維模型;目標選定區域包括:三維模型中的邊緣區域;內容資訊包括:網格頂點或者體素的座標資訊。
在本申請實施例中,電子設備可以對三維模型對應的紋理貼圖進行邊緣檢測,得到紋理貼圖的邊緣區域即為三維模型的邊緣區域。
在本申請實施例中,電子設備可以對邊緣區域的網格頂點(mesh定點)或體素資訊進行內容修改來嵌入浮水印。這裡,電子設備可以先將紋理貼圖轉換到頻域,然後和頻域浮水印資訊疊加,最後將疊加後的頻譜反變換回時域,得到嵌入了浮水印的紋理貼圖,也包含預設浮水印資訊的三維模型。在檢測時,可以對紋理貼圖進行相同的處理,並提取其中的“浮水印”資訊進行比對,以驗證是否存在相應的浮水印。
在本申請實施例中,mesh定點/體素等資訊可以看作是一個陣列,而預設浮水印資訊可以為二進位編碼,如此,電子設備可以將陣列的LSB修改為預設浮水印資訊中對應的一位元二進位編碼。在檢測時,同樣可以提取相應的LSB資訊進行比對。
可以理解的是,將預設浮水印資訊嵌入3D模型的邊緣區域,可以減少預設浮水印資訊對3D模型的外觀的影響,提高3D模型攜帶浮水印的顯示效果。並且,通過提取3D模型的邊緣區域的內容資訊,就可以獲取預設浮水印資訊,從而實現浮水印鑒別,以驗證預設浮水印資訊正確性。
本申請實施例提供了一種浮水印添加方法,該方法的基本思想是:首先,電子設備獲取待處理資訊;然後,電子設備將待處理資訊輸入至第一生成模型中,得到第一多媒體內容;第一多媒體內容包含預設浮水印資訊。一方面,本申請實施例將待處理資訊資訊輸入至第一生成模型中,即可得到帶有預設浮水印資訊的第一多媒體內容,這樣僅一次處理即可獲得帶有浮水印資訊的多媒體內容,從而提高了浮水印資訊添加的簡單性和快捷性。另一方面,本申請實施例中第一生成模型是基於包含浮水印資訊的多媒體內容訓練得到的。因此,在對第一生成模型進行訓練的過程中,可以通過包含浮水印資訊的多媒體內容更好地學習到預設浮水印資訊的特徵,從而第一多媒體內容可以隱式的包含預設浮水印資訊,相比於直接將浮水印資訊加入至多媒體內容相比,第一多媒體內容包含的浮水印資訊具有不易被篡改的特點,從而可以提高浮水印資訊的安全性及保密性。
圖5為本申請實施例提供的一種可選的浮水印添加方法的流程示意圖四,該方法為AI模型為生成作品自動添加浮水印的方法二,如圖5所示,該方法可以包括:S301至S302。
S301、獲取待處理資訊。
S302、將待處理資訊輸入至第一生成模型中,得到第一多媒體內容;第一多媒體內容包含預設浮水印資訊;其中,第一生成模型是基於包含浮水印資訊的多媒體內容訓練得到的。
其中,S301的實現可以參照S101的描述,此處不再贅述。
在本申請實施例中,第一生成模型根據待處理資訊生成包含預設浮水印資訊的第一多媒體內容。其中,訓練第一生成模型所採用的真值多媒體內容是包含預設浮水印資訊的多媒體內容。因此,在訓練過程中,第一生成模型可以學習到為多媒體內容添加預設浮水印資訊的方式,訓練完成後,第一生產模型生成的第一多媒體內容為嵌入了預設浮水印資訊的多媒體內容。
在本申請實施例中,關於預設浮水印資訊的描述可以參照S102中對預設浮水印資訊的描述,此處不再贅述。
需要說明的是,真值多媒體內容中預設浮水印資訊為顯示體現,則第一多媒體內容中預設浮水印資訊也為顯示體現;真值多媒體內容中預設浮水印資訊為隱式體現,則第一多媒體內容中預設浮水印資訊也為隱式體現。對於顯示浮水印資訊的添加方式和隱式浮水印的添加方式,可以參照S102中對添加顯示浮水印和添加隱式浮水印的描述,此處不再贅述。
在本申請的一些實施例中,基於圖5,如圖6所示,S302中將待處理資訊輸入至第一生成模型中,得到第一多媒體內容;第一多媒體內容包含預設浮水印資訊的實現之前,方法還包括S303至S305。
S303、將文本資訊輸入至當前原始生成模型,得到當前多媒體內容。
S304、將當前多媒體內容與對應的真值多媒體內容之間的內容差值,確定為當前生成損失。
需要說明的是,S303至S304的實現可以參照S103至S104的描述,此處不再贅述。
S305、在當前生成損失小於或者等於目標生成損失閾值,或者當前生成更新次數大於或者等於最大生成次數的情況下,將當前原始生成模型作為第一生成模型。
在本申請實施例中,模型訓練的截止條件可以包括:當前生成損失是否小於或等於生成損失閾值,和/或當前生成更新次數是否大於最大生成次數。其中,當前生成更新次數表徵當前原始生成模型的訓練次數。最大生成次數和生成損失閾值可以根據需要設置,對此本申請實施例不作限制。
在本申請的一些實施例中,在當前生成損失大於生成損失閾值的情況下,電子設備可以根據當前生成損失更新當前原始生成模型,得到更新後的原始生成模型。
在本申請實施例中,電子設備在得到當前生成損失之後,需要判斷當前生成損失是否大於生成損失閾值,如果是,則需要根據當前生成損失更新當前原始生成模型,否則需要停止訓練。
可以理解的是,在真值多媒體內容包含預設浮水印資訊的情況下,電子設備可以基於包含預設浮水印資訊的真值多媒體內容,使第一生成模型在訓練過程中學習到如何生成包含預設浮水印資訊的第一多媒體內容,提高浮水印的安全性,以及第一生成模型生成第一多媒體內容的版權保護效果。
在本申請的一些實施例中,S304中將當前多媒體內容與對應的真值多媒體內容之間的內容差值,確定為當前生成損失之前的實現,可以包括:S3041至S3043。
S3041、將文本資訊輸入至第二生成模型中,得到第二多媒體內容。
S3042、將預設浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容。
S3043、基於真值多媒體內容對原始生成模型進行訓練,得到第一生成模型。
其中,S3041至S3042的實現可以參照S107至S108的描述,此處不再贅述。
在本申請的一些實施例中,S3042中將預設浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容之前的實現,可以包括:S401-S402。
S401、獲取用於描述第一生成模型的描述資訊。
S402、將描述資訊進行編碼,得到預設浮水印資訊。
其中,S401至S402的實現可以參照S1081至S1082的描述,此處不再贅述。
在本申請的一些實施例中,S3042中將預設浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容的實現,可以包括:S501-S504。
S501、將浮水印資訊進行頻域轉換,得到頻域浮水印資訊;S502、將第二多媒體內容進行頻域轉換,得到頻域多媒體內容;S503、將頻域浮水印資訊與頻域多媒體內容進行頻域疊加,得到頻域真值多媒體內容;S504、對頻域多媒體內容進行時域轉換,得到真值多媒體內容。
其中,S501至S504的實現可以參照S201至S204的描述,此處不再贅述。
在本申請的一些實施例中,S3042中將預設浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容的實現,可以包括:基於預設浮水印資訊,對第二多媒體內容中目標選定區域的內容資訊進行修改,得到真值多媒體內容;內容資訊包括以下至少一種:圖元資訊、亮度資訊、座標資訊、密度資訊。
在本申請的一些實施例中,目標選定區域的內容資訊包括預設數量個內容資訊;預設數量與浮水印資訊的位元數相同;基於預設浮水印資訊,對第二多媒體內容中目標選定區域進行修改,得到真值多媒體內容的實現,可以包括:將第二多媒體內容中預設數量個內容資訊中每個內容資訊的最低有效位元修改為對應的一位元預設浮水印資訊,得到真值多媒體內容。
在本申請的一些實施例中,第二多媒體內容包括:圖像;目標選定區域包括:圖像的邊緣區域;內容資訊包括:圖元資訊。
在本申請的一些實施例中,第二多媒體內容包括:視頻;目標選定區域包括:視頻中的預設視頻幀的邊緣區域;內容資訊包括:圖元資訊。
在本申請的一些實施例中,第二多媒體內容包括:三維模型;目標選定區域包括:三維模型中的邊緣區域;內容資訊包括:網格頂點或者體素的座標資訊。
其中,第二多媒體內容包括圖像、視頻和三維模型時,目標選定區域以及內容資訊的設置可以參照AI模型為生成作品自動添加浮水印的方法一中相關的描述,此處不再贅述。
本申請實施例還提供一種浮水印添加方法,該方法可以包括:S601-S604。
S601、獲取待處理資訊和用於描述第二生成模型的描述資訊;其中,待處理資訊為文本、圖像、音訊和三維模型中的任意一種。
S602、將待處理資訊輸入至第二生成模型中,得到第二多媒體內容。
S603、對描述資訊進行編碼處理,得到浮水印資訊。
其中,S603的實現可以參照S1082的描述,此處不再贅述。
S604、將預設浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容。
在本申請實施例中,用於描述第二生成模型的描述資訊可以包括以下至少一種:版本資訊、創建時間資訊、名稱、創建作者資訊等。
在本申請實施例中,在電子設備將待處理資訊輸入至第二生成模型中,可以得到待處理資訊對應的第二多媒體內容。第二多媒體內容不包含用於體現第二生成模型的描述資訊的浮水印資訊。第二多媒體內容包括以下至少一種:圖像、視頻、3D模型。
在本申請實施例中,電子設備在得到第二多媒體內容之後,可以將浮水印資訊嵌入至第二多媒體內容中,得到真值多媒體內容。真值多媒體內容中的浮水印資訊可以為顯示浮水印,也可以為隱式浮水印。添加隱式浮水印的方法參見S102中的描述,此處不再贅述。
可以理解的是,由於電子設備可以對任意描述資訊進行編碼,得到浮水印資訊,再將浮水印資訊嵌入到第二生成模型生成的第二多媒體內容中,可以得到帶有任意浮水印資訊的真值多媒體內容;如此,能夠提高真值多媒體內容中所添加的浮水印資訊的靈活性。
在本申請的一些實施例中,S604中將浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容的實現,可以包括:S6041-S6044。
S6041、將浮水印資訊進行頻域轉換,得到頻域浮水印資訊。
S6042、將第二多媒體內容進行頻域轉換,得到頻域多媒體內容。
S6043、將頻域浮水印資訊與頻域多媒體內容進行頻域疊加,得到頻域多媒體內容。
S6044、對頻域多媒體內容進行時域轉換,得到真值多媒體內容。
在本申請的一些實施例中,S604中將浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容的實現,可以包括:基於浮水印資訊,對第二多媒體內容中目標選定區域的內容資訊進行修改,得到真值多媒體內容;內容資訊包括以下至少一種:圖元資訊、亮度資訊、座標資訊、密度資訊。
在本申請的一些實施例中,目標選定區域的內容資訊包括預設數量個內容資訊;預設數量與浮水印資訊的位元數相同;S604中將浮水印資訊嵌入到第二多媒體內容中,得到真值多媒體內容的實現,可以包括:將第二多媒體內容中預設數量個內容資訊中每個內容資訊的最低有效位元修改為對應的一位元浮水印資訊,得到真值多媒體內容。
在本申請的一些實施例中,第二多媒體內容包括:圖像;目標選定區域包括:圖像的邊緣區域;內容資訊包括:圖元資訊。
在本申請的一些實施例中,第二多媒體內容包括:視頻;目標選定區域包括:視頻中的預設視頻幀的邊緣區域;內容資訊包括:圖元資訊。
在本申請的一些實施例中,第二多媒體內容包括:三維模型;目標選定區域包括:三維模型中的邊緣區域;內容資訊包括:網格頂點或者體素的座標資訊。
其中,第二多媒體內容包括圖像、視頻和三維模型時,目標選定區域以及內容資訊的設置可以參照AI模型為生成作品自動添加浮水印的方法一中相關的描述,此處不再贅述。
可以理解的是,電子設備可以對第二生成模型生成的第二多媒體內容,添加預設浮水印資訊,得到第一多媒體內容,使第一多媒體內容能夠包含預設浮水印資訊,這通常通過對多媒體內容的內容資訊進行一些微小的調整來實現,例如在圖元值中插入最低有效位元(LSB)資訊或者對圖像的頻譜進行微小的調整。由於預設浮水印資訊為第二生成模型的描述資訊,從而實現對第一多媒體內容的版權保護。該技術的基本思想是將數位資訊編碼為一系列的浮水印資訊,並將浮水印資訊嵌入到圖像的圖元值中。
需要說明的是,基於編碼方式的添加浮水印通常是對特定的編碼方式進行修改,例如修改圖像的DCT係數、修改音訊的頻域係數等。
在本申請的一些實施例中,電子設備還可以將隱式浮水印技術與加密技術相結合,對預設浮水印資訊進行加密得到加密浮水印資訊,再將加密浮水印資訊嵌入多媒體內容。例如,電子設備可以使用公開金鑰密碼學演算法將預設浮水印資訊加密,減少預設浮水印資訊被獲取概率,從而提高浮水印的安全性。
圖7為本申請實施例提供的一種可選的浮水印鑒別方法的流程示意圖,如圖7所示,該方法可以包括:S701至S702。
S701、獲取待檢測多媒體內容;S702、將待檢測多媒體內容輸入鑒別模型,得到浮水印鑒別結果;浮水印鑒別結果表徵待檢測多媒體內容是否為第一生成模型生成的;其中,鑒別模型是將當前多媒體內容作為正樣本進行訓練得到的;當前多媒體內容為當前原始生成模型根據文本資訊生成的;訓練完成後的當前原始生成模型為第一生成模型;第一生成模型用於生成包含浮水印資訊的多媒體內容。
在本申請實施例中,待檢測多媒體內容中包含有浮水印資訊,鑒別模型用於對待鑒別多媒體內容中的浮水印資訊進行鑒別,判斷待檢測多媒體內容是否為第一生成模型生成的。這裡,待檢測多媒體內容可以為以下至少一種:圖像、視頻、三維模型。
在本申請實施例中,電子設備可以對原始鑒別模型進行訓練,得到鑒別模型,以及對將待處理資訊輸入原始生成模型進行訓練,得到第一生成模型。電子設備每一次訓練可以得到當前原始鑒別模型和當前原始生成模型。需要說明的是,電子設備將文本資訊輸入當前原始生成模型,可以生成當前多媒體內容,根據當前多媒體內容實現第一生成模型的當前次訓練。電子設備在得到當前多媒體內容後,可以將當前多媒體內容作為當前原始鑒別模型的正樣本,和負樣本一起輸入當前原始鑒別模型,實現對鑒別模型的當前次訓練。
在本申請實施例中,負樣本為非第一生成模型生成的多媒體內容。例如,負樣本可以為其他生成模型(非第一生成模型)生成的多媒體內容,也可以為非模型生成的多媒體內容。
在本申請的一些實施例中,S702中將待檢測多媒體內容輸入鑒別模型,得到浮水印鑒別結果之前的實現,可以包括S7021至S7023。
S7021、將正樣本與負樣本一起輸入當前鑒別模型,得到針對正樣本的當前第一鑒別結果和針對負樣本的當前第二鑒別結果;負樣本為非第一生成模型生成的多媒體內容。
S7022、根據當前第一鑒別結果和當前第二鑒別結果確定當前鑒別損失。
其中,S7021-S7022的實現可以參見S1051-S1052的描述,此處不再贅述。
S7023、在當前鑒別損失小於或者等於鑒別損失閾值,或者當前鑒別更新次數大於或者等於最大鑒別次數的情況下,將當前鑒別模型作為鑒別模型。
在本申請實施例中,鑒別模型訓練的截止條件可以包括:當前鑒別損失是否小於或等於鑒別損失閾值,和/或當前鑒別更新次數是否大於最大鑒別次數。其中,當前鑒別更新次數表徵當前原始鑒別模型的訓練次數。最大鑒別次數和鑒別損失閾值可以根據需要設置,對此本申請實施例不作限制。
在本申請實施例中,在浮水印鑒別結果表徵待檢測多媒體內容為第一生成模型生成的情況下,電子設備可以獲取待檢測多媒體內容中包含的浮水印資訊,或者獲取浮水印資訊對應的第一生成模型的描述資訊。
在本申請的一些實施例中,在第一生成模型訓練過程中,採用的真值多媒體內容中包含的浮水印資訊對應的第一生成模型的描述資訊已知的情況下,鑒別模型對待檢測多媒體內容進行鑒別的結果,若表徵待檢測多媒體內容為第一生成模型生成,則鑒別結果還可以包括第一生成模型的描述資訊。
在本申請的一些實施例中,在第一生成模型訓練過程中,採用的真值多媒體內容中包含的浮水印資訊對應的第一生成模型的描述資訊未知的情況下,鑒別模型對待檢測多媒體內容進行鑒別的結果,若表徵待檢測多媒體內容為第一生成模型生成,則鑒別結果還可以包括浮水印資訊。
在本申請的一些實施例中,S7022中根據當前第一鑒別結果和當前第二鑒別結果確定當前鑒別損失之後的實現,可以包括:在當前目標生成損失大於鑒別損失閾值的情況下,根據當前鑒別損失更新當前鑒別模型,得到更新後的鑒別模型。
在本申請實施例中,電子設備在確定當前鑒別損失之後,可以判斷當前鑒別損失是否小於或者等於鑒別損失閾值;如果是,則停止訓練,將當前鑒別模型作為鑒別模型;否則,可以根據當前鑒別損失更新當前鑒別模型,得到更新後的鑒別模型。
在本申請的一些實施例中,S7022中根據當前第一鑒別結果和當前第二鑒別結果確定當前鑒別損失的實現,可以包括:S70221至S70222。
S70221、將當前第一鑒別結果與當前正樣本標籤進行對比,得到當前第一鑒別損失;以及,將當前第二鑒別結果與當前負樣本標籤進行對比,得到當前第二鑒別損失。
在本申請實施例中,電子設備在得到當前第一鑒別結果和當前第二鑒別結果之後,可以將當前第一鑒別結果和當前正樣本中的當前正樣本標籤進行對比,得到當前第一鑒別損失,以及,將當前第二鑒別結果和當前負樣本中的當前負樣本標籤進行對比,得到當前第二鑒別損失。其中,當前第一鑒別損失可以表徵當前第一鑒別結果和當前正樣本標籤之間的差距;當前第二鑒別損失可以表徵當前第二鑒別結果和當前負樣本標籤之間的差距。
S70222、對當前第一鑒別損失和當前第二鑒別損失進行加權求和,得到當前鑒別損失。
在本申請實施例中,電子設備在確定當前第一鑒別損失和當前第二鑒別損失之後,可以對當前第一鑒別損失和當前第二鑒別損失進行加權求和,得到當前鑒別損失。其中,當前第一鑒別損失和當前第二鑒別損失的權值可以根據實際需要設置,本申請實施例不作限制。
在本申請的一些實施例中,S702中將待檢測多媒體內容輸入鑒別模型,得到浮水印鑒別結果之後的實現,可以包括:S703至S704。
S703、獲取待檢測多媒體內容中的浮水印資訊;S704、將目標浮水印資訊進行解碼處理,得到解碼浮水印資訊;解碼浮水印資訊用於表徵第一生成模型的描述資訊。
在本申請實施例中,電子設備在獲取待檢測多媒體內容中的浮水印資訊之後,可以對浮水印資訊進行解碼處理,得到第一生成模型的描述資訊。
在本申請實施例中,第一生成模型的描述資訊用於表徵待檢測多媒體內容對應的生成模型,也即第一生成模型的描述資訊。比如:版權資訊、創建資訊、模型資訊等等,本申請實施例對此不作限制。
示例性的,圖8為本申請實施例提供的一種可選的模型訓練過程的流程示意圖二,如圖8所示,電子設備可以先將文本資訊輸入至當前原始生成模型中,得到當前多媒體內容;然後,將當前多媒體內容和對應的真值多媒體內容之間的圖元差值,作為當前生成損失;其中,第二多媒體內容為利用第二生成模型生成的,真值多媒體內容為通過將預設浮水印資訊嵌入至第二多媒體內容生成的;然後,電子設備可以根據當前生成損失,對當前原始生成模型進行反覆運算訓練,得到第一生成模型;再將文本資訊輸入至第一生成模型中,得到正樣本;將正樣本和負樣本共同輸入至當前鑒別模型中,得到正樣本的當前第一鑒別結果和負樣本的當前第二鑒別結果;將當前第一鑒別結果與其對應的當前第一鑒別標籤之間的差值,作為當前第一鑒別損失,當前第二鑒別結果與其對應的當前第二鑒別標籤之間的差值,作為當前第二鑒別損失;最後,將當前第一鑒別損失和當前第二鑒別損失的加權和,作為當前鑒別損失,根據當前鑒別損失,對當前鑒別模型進行反覆運算訓練,得到鑒別模型。
在本申請的一些實施例中,S703中獲取待檢測多媒體內容中的浮水印資訊的實現,可以包括:S7031至S7033。
S7031、將待檢測多媒體內容進行頻域轉換,得到頻域待檢測多媒體內容;S7032、通過預設頻域濾波器,提取頻域待檢測多媒體內容中預設頻域的分量資訊,並將預設頻域的分量資訊作為待檢測多媒體內容的頻域浮水印資訊;在本申請實施例中,由於浮水印資訊通常會被轉換到預設頻域,再和多媒體內容的頻域向疊加,得到待檢測多媒體內容。在一些實施例中,預設頻域為第一頻域,則多媒體內容所在頻域為第二頻域,第一頻域與第二頻域不同。因此,電子設備可以通過預設頻域濾波器,從待檢測多媒體內容中提取出預設頻域的分量資訊,得到頻域浮水印資訊。頻域浮水印資訊即為和多媒體內容的頻域疊加後得到頻域到媒體內容的資訊。
在本申請的一些實施例中,第一頻域為高頻頻域,第二頻域為低頻頻域。預設頻域濾波器可以為高通濾波器。電子設備可以將待檢測多媒體內容轉換到頻域,通過高通濾波器提取高頻頻域的分量資訊,得到頻域浮水印資訊。這些高頻分量可以是特定頻率的雜訊,也可以是圖像或視頻幀中具有特定特徵的紋理或邊緣資訊等。
S7033、對頻域浮水印資訊進行時域轉換,得到浮水印資訊。
在本申請實施例中,電子設備在得到頻域浮水印資訊之後,可以對頻域浮水印資訊進行時域轉換,得到浮水印資訊。
在本申請的一些實施例中,S703中獲取待檢測多媒體內容中的浮水印資訊的實現,還可以包括:S7034至S7035。
S7034、確定待檢測多媒體內容中目標選定區域的預設數量個內容資訊;目標選定區域的內容資訊包括以下至少一種:圖元資訊、亮度資訊、座標資訊、密度資訊;預設數量與浮水印資訊的位元數相同;在本申請的一些實施例中,目標選定區域包含的內容資訊的數量等於浮水印資訊的位元數。電子設備可以按照預設提取順序,從目標選定區域中提取內容資訊。預設提取順序可以根據需要設置,對此,本申請實施例不作限制。
示例性的,目標選定區域中的預設數量個內容資訊為:圖像的4個頂角中每個頂角的一個圖元,共計4個圖元。預設提取順序可以為:左上、右上、左下和右下。
S7035、將預設數量個內容資訊中的最低有效位元對應的資訊,作為浮水印資訊。
在本申請實施例中,電子設備在獲取預設數量個內容資訊之後,可以按照預設選定順序排列預設數量個內容資訊,得到浮水印資訊。其中,預設選定順序為添加浮水印資訊時的順序,具體參見S10800中的描述。
示例性的,內容資訊為圖元資訊;目標選定區域包含3個圖元資訊;電子設備可以按照從小到大的預設選定順序,將目標選定區域中第1個圖元的LSB“1”作為浮水印資訊的第一個編碼位元,將目標選定區域中第2個圖元的LSB“0”作為浮水印資訊的第2個編碼位元,將目標選定區域中第3個圖元“1”的LSB作為浮水印資訊的第3個編碼位元,從而得到浮水印資訊“101”。
在本申請的一些實施例中,電子設備在鑒別完成,獲取浮水印資訊後,可以通過解碼器對浮水印資訊進行解碼處理,得到第一生成模型的描述資訊。其中,解碼器可以根據編碼器對第一生成模型的描述資訊的編碼方式配置。解碼器的實現可以參見前文中S1082的有關編碼步驟的相關描述,在此不再贅述。
示例性的,編碼器可以將第一生成模型的描述資訊“stable diffusion 1.5, 03/22/2023,XXX”)編碼為“00010010001101001000100110111111”,解碼器就可以將“00010010001101001000100110111111”解碼出“stable diffusion 1.5, 03/22/2023,XXX”)。
在本申請的一些實施例中,鑒別模型的注釋資訊包含第一生成模型的描述資訊,S403中獲取待檢測多媒體內容中的浮水印資訊之後的實現,還可以包括:在浮水印鑒別結果表徵待檢測多媒體內容為第一生成模型生成,且鑒別模型的注釋資訊中包含有第一生成模型的描述資訊的情況下,電子設備可以直接從注釋資訊中提取第一生成模型的描述資訊。
下面在一具體的實施例中對上述的浮水印添加方法進行詳細的解釋。
實施例1、基於編碼的浮水印添加方法:步驟1:將AI模型的資訊進行編碼,將一個AI模型的資訊等中繼資料(metadata)進行編碼。其中,中繼資料為描述資料的資料(data about data),主要是描述資料屬性(property)的資訊,或者說是用於提供某種資源的有關資訊的結構資料(structured about)。示例性的,將字串“stable diffusion 1.5, 03/22/2023,XXX”編碼成“00010010001101001000100110111111”等。即,將描述AI模型的相關資訊通過編碼器進行編碼,得到二進位的字串。
上述過程可以表示為:f (“stable diffusion 1.5, 03/22/2023,XXX”)。其中,f可以是一個編碼器,也可以是一個編碼/加密演算法,也可以是一個AI模型。同時隨著AIGC的大量發展和廣泛運用,也可以將這個編碼器f標準化,從而建立為一套國際標準來統一維護,之後所有的AI生成模型都可以使用這套標準編碼器來進行註冊並編解碼。
步驟2:將編碼的資訊嵌入AI模型生成的相應作品中,用步驟1中生成的編碼產生“浮水印資訊”並疊加到生成的作品中。
浮水印資訊可以是頻譜中的高頻分量(圖像的頻域表示通常被稱為頻譜,其中包括了各種頻率的分量。需要說明的是,將浮水印嵌入到高頻分量中的優點是,它可以使浮水印更難被檢測到,並且更容易被嵌入到圖像的細節中,從而不會影響圖像的視覺品質。
對於一張圖像,高頻分量表示的是圖像中變化快、細節多的區域,例如圖像的邊緣、紋理和細節等,即,將原始圖像,視頻幀或紋理貼圖轉換到頻域,並與編碼生成的“浮水印”頻譜疊加,得到嵌入浮水印後的頻譜。然後,將嵌入浮水印後的頻譜轉換回空域,得到具有浮水印資訊的圖像、視頻幀或紋理貼圖。
其中,紋理貼圖用於增強三維模型表面的視覺效果和真實感,通過紋理貼圖可以將一個圖像或者一個二維的圖案映射到三維模型的表面上,使得表面看起來更加真實、生動,增強視覺效果,紋理貼圖可以是一個具有多種顏色和紋理的圖案。
浮水印資訊也可以是修改作品選定區域(比如邊緣,紋理部分)中的圖元/體素最低有效位(LSB,Least Significant Bit)(即二進位數字的最右邊的一位),即最低有效位(LSB)是指二進位數字的最右邊的一位,它對應的權值為1。在數位圖像或視頻中,每個圖元通常由多個位組成,每個通道的圖元值可以表示為一個整數。通過將圖元值的最低有效位元進行修改,可以嵌入一些額外的資訊,例如版權資訊或者數位簽章等。對於單通道圖像或視頻,可以將圖元值的最低有效位元替換為所需的資訊,以嵌入浮水印。對於多通道圖像或視頻,可以選擇其中一個通道進行嵌入,或者將多個通道的最低有效位元組合在一起以嵌入更多資訊。提取浮水印時,需要對選定區域中的圖元/體素進行掃描,並提取其中的最低有效位以獲取嵌入的資訊。需要注意的是,修改圖元值的最低有效位元會對圖像或視頻的品質產生一定的影響,因此需要謹慎地選擇修改的圖元/體素區域和嵌入的信息量。
1)、對於圖像,可以選擇圖像邊緣部分(通過一些邊緣檢測演算法確定圖像的邊緣部分),從而修改每個圖元的LSB;(將每個圖元的二進位值)。
2)、對於視頻,可以修改抽樣幀中每幀4個頂角的圖元的LSB,或者也可以是第N幀的邊緣部分,從而修改每個圖元的LSB。其中,第N幀可以為預設的一些幀(至少一幀)作為浮水印載體,即提前標記好的幀。
在視頻中,每幀都包含了許多圖元,修改所有圖元的LSB會對視頻的品質和壓縮率造成影響,因此通常只修改少量圖元的LSB來隱藏浮水印。而選擇每幀的四個頂角的圖元是因為這些圖元的變化通常不會對視頻的感知品質產生顯著的影響,並且這些圖元的位置相對固定,方便在後續的浮水印鑒別中確定浮水印位置。另外,視頻的邊緣部分往往包含了一些較為平滑和穩定的區域,對於LSB的修改比較容易隱藏,而且這些區域的圖元值變化較小,也不容易引起人眼的注意。相比之下,如果將浮水印嵌入到視頻的中心部分或者變化比較劇烈的區域,容易引起視頻品質的損失和浮水印的失效,此外,邊緣部分的圖元數量相對較少,只需要修改其中的一小部分圖元即可實現浮水印的嵌入,這樣可以減少嵌入過程中的計算量和時間成本。
需要說明的是,如果要選擇邊緣部分進行LSB的修改,那麼需要先對該幀進行邊緣檢測,以確定哪些圖元屬於邊緣部分。
3)、對於3D模型,可以對紋理貼圖進行類似圖像方式的LSB修改,也可以對mesh定點/體素等資訊的LSB修改。其中,mesh定點指的是每個面片所包含的頂點,通常由其在3D坐標系中的座標值和法線向量等資訊組成。而體素是一種類似於圖元的概念,在3D空間中將空間劃分為一系列小的立方體,每個立方體即為一個體素,具有自己的位置資訊和屬性資訊,例如體素的顏色、密度等等。對於紋理貼圖,可以先將紋理貼圖轉換到頻域,然後與編碼生成的“浮水印”頻譜疊加,最後將疊加後的頻譜反變換回空域,得到嵌入了浮水印的紋理貼圖。在檢測時,可以對紋理貼圖進行相同的處理,並提取其中的“浮水印”資訊進行比對,以驗證是否存在相應的浮水印。
對於mesh定點/體素等資訊的LSB修改,可以將這些資訊看作是一個陣列,然後對陣列中的每個元素的LSB進行修改。
上述方案1和方案2這兩種“浮水印”添加方式均對原始作品在視覺上不會產上影響,從而難以被肉眼發現。
需要說明的是,儘管LSB隱寫是一種簡單而有效的隱寫技術,但它也有一些局限性,例如,它的容量有限,只能在每個圖元的LSB中嵌入一個比特。此外,攻擊者可能會使用特殊的演算法來檢測和刪除嵌入的資訊。因此,為了確保資訊的安全性,通常需要採取多種隱寫技術和加密技術來提高其安全性。
2、基於編碼的浮水印鑒別方法:將給定的一個作品(圖像,視頻,3D模型)轉換成頻譜並通過高通濾波提取高頻分量資訊,或者提取特定圖元的LSB,再用解碼器g計算解碼,從而還原出原始文本/版權資訊(如 “stable diffusion 1.5, 03/22/2023,XXX”)。
需要說明的是,關於作品的添加的浮水印資訊可以記錄在浮水印添加記錄,以便於在後續浮水印鑒別時,根據浮水印添加記錄中的相關資訊選擇合適的檢測方法。印添加記錄可以在添加浮水印的時候保存在一個單獨的檔中,這個檔可以包括以下資訊:浮水印嵌入位置:浮水印嵌入在圖像、視頻、音訊等檔的哪個部分,比如高頻分量資訊或者特定圖元的LSB。浮水印嵌入方式:浮水印嵌入的方式,比如是基於編碼的浮水印添加方式還是LSB修改的方式。浮水印嵌入參數:具體的嵌入參數,比如編碼演算法、嵌入強度、LSB修改的位置和數量等。通過保存這些資訊,可以在檢測浮水印時準確地確定檢測方式,並從正確的位置提取或檢測浮水印資訊。
實施例2、基於AI模型的浮水印添加方法。方案1描述了一種基於編解碼的AI模型生成的藝術作品的隱式浮水印添加/檢測方案。這種方案的好處是簡單快捷,且便於標準化,但有一個缺點是容易被人為篡改(例如修改幾個圖元便可破壞浮水印)。另一種添加隱式浮水印的思路是通過AI模型,具體如下:在訓練AI作品生成模型(定義為模型A)的時候(,同時使用多工訓練的方法訓練一個AI作品生成判別模型(定義為模型B)。將模型A生成的作品作為正樣本輸入模型B,同時將其他大量採集的資料作為負樣本(包含非AI模型生成的作品,以及其他AI模型生成的作品)來訓練模型B。模型B的輸出只有是或者否(yes or no),表示該張圖是否由模型A生成。由於模型A和B是共同訓練產出,所以有強烈的配對性,並且訓練模型B的過程會隱式將“浮水印”添加入模型A的生成過程,從而最終引導模型A生成出的作品加入了隱式浮水印。
具體來說,有兩個模型,一個是生成模型A,用來生成藝術作品,另一個是判別模型B,用來判別一張圖像是否是由模型A生成的。在訓練模型A的時候,還會使用訓練資料來聯合訓練模型B,將模型A生成的作品作為正樣本,將其他大量資料作為負樣本。模型B的輸出是二元分類,表示該張圖像是否是由模型A生成的。在這個訓練過程中,模型B實際上起到了“浮水印”的作用。因為模型B只有在訓練過程中才會得到標籤,也就是說,只有在訓練過程中,模型A生成的藝術作品才會被打上“浮水印”。而這種“浮水印”是隱式的,因為它並沒有直接在圖像中嵌入任何資訊。相反,這種“浮水印”是由模型B在訓練過程中產生的,因為模型B會學習到區分模型A生成的藝術作品和其他資料的特徵。一旦模型A和B訓練完成,可以使用模型B來檢測一張圖像是否是由模型A生成的。這時候,只需要將這張圖像輸入到模型B中,看看它的輸出是yes還是no。如果輸出是yes,那麼就可以認為這張圖像是由模型A生成的,並且也可以認為它帶有“浮水印”。
需要說明的是,訓練模型B的過程是通過輸入模型A生成的作品和其他大量資料來訓練,這裡的目的是讓模型B可以判別哪些作品是由模型A生成的。在這個過程中,如果模型A生成的作品與其他作品沒有明顯區別,那麼模型B也無法將其區分出來,這時就需要引入“浮水印”來區分。具體來說,可以在模型B的訓練資料集中加入一些由模型A生成的作品,並將其標注為“由模型A生成”。這樣,在訓練模型B的過程中,模型B會學習到由模型A生成的作品的特徵,從而能夠準確地判別模型A生成的作品。因此,在模型B訓練的過程中,模型A生成的作品會被標注為“由模型A生成”,這個標注就是“浮水印”。在模型A生成作品時,它會在生成過程中隱式地考慮到這個“浮水印”,從而使得生成的作品中也包含了這個“浮水印”。這樣,就可以在後續的檢測過程中,通過檢測這個“浮水印”來確定該作品是由模型A生成的。
由於模型式強配對訓練產出,對於每一個生成模型A都會有一個獨有浮水印鑒別模型B。所以此方案在浮水印標準化上不如前面的方案,但也可以通過收集/註冊所有的鑒別模型B來實現版權的標準化/集中化控制。
2、基於AI模型的浮水印鑒別方法:檢測浮水印的方法很簡單,只需要將作品傳入模型B,模型B會判斷作品是否由模型A生成。
本申請實施例帶來的有益效果:本申請實施例提出的一種基於AI生成的藝術作品加入隱式浮水印的演算法,從而更好的管理AI生成的藝術作品的版權,隱式浮水印將會在生成的藝術作品中(圖像,視頻,3D作品)中嵌入AI模型的相關資訊,不容易被使用者發現但卻可以簡單被電腦/模型解碼,並且同時不會影響作品的美觀度。
本申請實施例提出的技術方案的關鍵點在於以下幾點:1)、本申請實施例對AI模型生成的藝術作品(圖像,視頻,3d模型等)加入隱式浮水印;2)、本申請實施例中的浮水印資訊包含了AI模型資訊以及其他有效中繼資料(創建日期、作者、檔案格式、檔大小、地理位置),從而實現版權管理與保護;3)、本申請實施例針對不同形態的藝術作品分別提出了具體的加入與檢測隱式浮水印的方法,包括編碼型與模型型浮水印演算法。
基於前述的實施例,本申請實施例提供的一種可選的浮水印添加裝置的結構示意圖一,如圖9所示,浮水印添加裝置10包括第一獲取單元11和第一生成單元12;其中,第一獲取單元11,用於獲取待處理資訊;第一生成單元12,用於將所述待處理資訊輸入至第一生成模型中,得到第一多媒體內容;所述第一多媒體內容包含預設浮水印資訊;其中,所述第一生成模型與鑒別模型是聯合訓練得到的;所述鑒別模型用於鑒別多媒體內容是否為所述第一生成模型生成。
在一實施例中,所述第一生成單元12,還用於將文本資訊輸入至當前原始生成模型,得到當前多媒體內容;將所述當前多媒體內容與對應的真值多媒體內容之間的內容差值,確定為當前生成損失;將所述當前多媒體內容作為正樣本,與負樣本一起輸入當前鑒別模型,得到鑒別損失;所述負樣本為非第一生成模型生成的多媒體內容;根據所述鑒別損失和所述當前生成損失,更新所述當前原始生成模型,得到所述第一生成模型。
在一實施例中,所述第一生成單元12,還用於將所述當前多媒體內容作為正樣本,與負樣本一起輸入當前鑒別模型,得到針對所述正樣本的當前第一鑒別結果和針對所述負樣本的當前第二鑒別結果;根據所述當前第一鑒別結果和所述當前第二鑒別結果確定當前鑒別損失。
在一實施例中,所述第一生成單元12,還用於根據所述當前鑒別損失和所述當前生成損失,確定當前目標生成損失;在所述當前目標生成損失小於或者等於目標生成損失閾值,或者所述當前生成更新次數大於或者等於所述最大生成次數的情況下,將所述當前原始生成模型作為所述第一生成模型。
在一實施例中,所述第一生成單元12,還用於在所述當前生成損失大於生成損失閾值的情況下,根據所述當前生成損失更新所述當前原始生成模型,得到更新後的原始生成模型。
在一實施例中,所述真值多媒體內容為帶有預設浮水印資訊的多媒體內容,所述第一生成單元12,還用於將文本資訊輸入至第二生成模型中,得到第二多媒體內容;將浮水印資訊嵌入到所述第二多媒體內容中,得到所述真值多媒體內容;基於所述真值多媒體內容對原始生成模型進行訓練,得到所述第一生成模型。
在一實施例中,所述第一生成單元12,還用於獲取用於描述所述第一生成模型的描述資訊;將所述描述資訊進行編碼,得到所述浮水印資訊。
在一實施例中,所述第一生成單元12,還用於將所述預設浮水印資訊進行頻域轉換,得到第一頻域的頻域浮水印資訊;將所述第二多媒體內容進行頻域轉換,得到第二頻域的頻域多媒體內容;將所述頻域浮水印資訊與所述頻域多媒體內容進行頻域疊加,得到所述真值多媒體內容。
在一實施例中,所述第一生成單元12,還用於基於所述預設浮水印資訊,對所述第二多媒體內容中目標選定區域的內容資訊進行修改,得到所述真值多媒體內容;所述內容資訊包括以下至少一種:圖元資訊、亮度資訊、座標資訊、密度資訊。
在一實施例中,所述目標選定區域的內容資訊包括預設數量個內容資訊;所述預設數量與所述預設浮水印資訊的位元數相同;所述第一生成單元12,還用於將所述第二多媒體內容中所述預設數量個內容資訊中每個內容資訊的最低有效位元修改為對應的一位元預設浮水印資訊,得到修改後的第二多媒體內容;將所述修改後的第二多媒體內容作為所述真值多媒體內容。
在一實施例中,所述第二多媒體內容包括:圖像;所述目標選定區域包括:所述圖像的邊緣區域;所述內容資訊包括:圖元資訊。
在一實施例中,所述第二多媒體內容包括:視頻;所述目標選定區域包括:所述視頻中的預設視頻幀的邊緣區域;所述內容資訊包括:圖元資訊。
在一實施例中,所述第二多媒體內容包括:三維模型;所述目標選定區域包括:所述三維模型中邊緣區域;所述內容資訊包括:網格頂點或者體素的座標資訊。
同樣基於前述的實施例,本申請實施例提供的一種可選的浮水印添加裝置的結構示意圖二,如圖10所示,浮水印添加裝置20包括第二獲取單元21和第二生成單元22;其中,所述第二獲取單元21,用於獲取待處理資訊;所述第二生成單元22,用於將所述待處理資訊輸入至第一生成模型中,得到第一多媒體內容;所述第一多媒體內容包含預設浮水印資訊;其中,所述第一生成模型是基於包含浮水印資訊的多媒體內容訓練得到的。
在一實施例中,所述第二生成單元22,還用於將文本資訊輸入至當前原始生成模型,得到當前多媒體內容;將所述當前多媒體內容與對應的真值多媒體內容之間的內容差值,確定為當前生成損失;所述真值多媒體內容為帶有浮水印資訊的多媒體內容;在所述當前目標生成損失小於或者等於目標生成損失閾值,或者所述當前生成更新次數大於或者等於所述最大生成次數的情況下,將所述當前原始生成模型作為所述第一生成模型。
在一實施例中,所述第二生成單元22,還用於在所述當前生成損失大於生成損失閾值的情況下,根據所述當前生成損失更新所述當前原始生成模型,得到更新後的原始生成模型。
在一實施例中,所述第二生成單元22,還用於將文本資訊輸入至第二生成模型中,得到第二多媒體內容;將預設浮水印資訊嵌入到所述第二多媒體內容中,得到所述真值多媒體內容;基於所述真值多媒體內容對原始生成模型進行訓練,得到所述第一生成模型。
在一實施例中,所述第二生成單元22,還用於獲取用於描述所述第一生成模型的描述資訊;將所述描述資訊進行編碼,得到所述預設浮水印資訊。
在一實施例中,所述第二生成單元22,還用於將所述浮水印資訊進行頻域轉換,得到頻域浮水印資訊;將所述第二多媒體內容進行頻域轉換,得到頻域多媒體內容;將所述頻域浮水印資訊與所述頻域多媒體內容進行頻域疊加,得到所述真值多媒體內容。
在一實施例中,所述第二生成單元22,還用於基於所述預設浮水印資訊,對所述第二多媒體內容中目標選定區域的內容資訊進行修改,得到所述真值多媒體內容;所述內容資訊包括以下至少一種:圖元資訊、亮度資訊、座標資訊、密度資訊。
在一實施例中,所述目標選定區域的內容資訊包括預設數量個內容資訊;所述預設數量與所述浮水印資訊的位元數相同,所述第二生成單元22,還用於將所述第二多媒體內容中所述預設數量個內容資訊中每個內容資訊的最低有效位元修改為對應的一位元浮水印資訊,得到修改後的第二多媒體內容;將所述修改後的第二多媒體內容作為所述真值多媒體內容。
在一實施例中,所述第二多媒體內容包括:圖像;所述目標選定區域包括:所述圖像的邊緣區域;所述內容資訊包括:圖元資訊。
在一實施例中,所述第二多媒體內容包括:視頻;所述目標選定區域包括:所述視頻中的預設視頻幀的邊緣區域;所述內容資訊包括:圖元資訊。
在一實施例中,所述第二多媒體內容包括:三維模型;所述目標選定區域包括:所述三維模型中邊緣區域;所述內容資訊包括:網格頂點或者體素的座標資訊。
同樣基於前述的實施例,本申請實施例提供的一種可選的浮水印添加裝置的結構示意圖三,如圖11所示,浮水印添加裝置30包括第三獲取單元31、第三生成單元32、編碼單元33和嵌入單元34;其中,所述第三獲取單元31,用於獲取待處理資訊和用於描述所述第二生成模型的描述資訊;所述第三生成單元32,用於將所述待處理資訊輸入至第二生成模型中,得到第二多媒體內容;所述編碼單元33,用於對所述描述資訊進行編碼處理,得到浮水印資訊;所述嵌入單元34,用於將所述浮水印資訊嵌入到所述第二多媒體內容中,得到所述真值多媒體內容。
在一實施例中,所述嵌入單元34,還用於將所述浮水印資訊進行頻域轉換,得到頻域浮水印資訊;將所述第二多媒體內容進行頻域轉換,得到頻域多媒體內容;將所述頻域浮水印資訊與所述頻域多媒體內容進行頻域疊加,得到所述真值多媒體內容。
在一實施例中,所述嵌入單元34,還用於基於所述浮水印資訊,對所述第二多媒體內容中目標選定區域的內容資訊進行修改,得到所述真值多媒體內容;所述內容資訊包括以下至少一種:圖元資訊、亮度資訊、座標資訊、密度資訊。
在一實施例中,所述目標選定區域的內容資訊包括預設數量個內容資訊;所述預設數量與所述浮水印資訊的位元數相同;所述嵌入單元34,還用於將所述第二多媒體內容中所述預設數量個內容資訊中每個內容資訊的最低有效位元修改為對應的一位元浮水印資訊,得到修改後的第二多媒體內容;將所述修改後的第二多媒體內容作為所述真值多媒體內容。
在一實施例中,所述第二多媒體內容包括:圖像;所述目標選定區域包括:所述圖像的邊緣區域;所述內容資訊包括:圖元資訊。
在一實施例中,所述第二多媒體內容包括:視頻;所述目標選定區域包括:所述視頻中的預設視頻幀的邊緣區域;所述內容資訊包括:圖元資訊。
在一實施例中,所述第二多媒體內容包括:三維模型;所述目標選定區域包括:所述三維模型中邊緣區域;所述內容資訊包括:網格頂點或者體素的座標資訊。
同樣基於前述的實施例,本申請實施例提供的一種可選的浮水印鑒別裝置的結構示意圖,如圖12所示,浮水印鑒別裝置40包括第四獲取單元41和鑒別單元42;其中,所述第四獲取單元41,用於獲取待檢測多媒體內容;所述鑒別單元42,用於將所述待檢測多媒體內容輸入鑒別模型,得到浮水印鑒別結果;所述浮水印鑒別結果表徵所述待檢測多媒體內容是否為第一生成模型生成的;其中,所述鑒別模型是將當前多媒體內容作為正樣本進行訓練得到的;所述當前多媒體內容為當前原始生成模型根據文本資訊生成的;訓練完成後的當前原始生成模型為第一生成模型;第一生成模型用於生成包含所述浮水印資訊的多媒體內容。
在一實施例中,所述鑒別單元42,還用於將正樣本與負樣本一起輸入當前鑒別模型,得到針對所述正樣本的當前第一鑒別結果和針對所述負樣本的當前第二鑒別結果;所述負樣本為非第一生成模型生成的多媒體內容;根據所述當前第一鑒別結果和所述當前第二鑒別結果確定當前鑒別損失;在所述當前鑒別損失小於或者等於鑒別損失閾值,或者所述當前鑒別更新次數大於或者等於所述最大鑒別次數的情況下,將所述當前鑒別模型作為所述鑒別模型。
在一實施例中,所述鑒別單元42,還用於在所述當前目標生成損失大於鑒別損失閾值的情況下,根據所述當前鑒別損失更新所述當前鑒別模型,得到更新後的鑒別模型。
在一實施例中,所述鑒別單元42,還用於將當前第一鑒別結果與當前正樣本標籤進行對比,得到當前第一鑒別損失;以及,將當前第二鑒別結果與當前負樣本標籤進行對比,得到當前第二鑒別損失;對所述當前第一鑒別損失和所述當前第二鑒別損失進行加權求和,得到所述當前鑒別損失。
在一實施例中,所述鑒別單元42,還用於在訓練所述第一生成模型過程中的真值多媒體內容為帶有浮水印資訊的多媒體內容的情況下,獲取所述待檢測多媒體內容中的所述浮水印資訊;將所述浮水印資訊進行解碼處理;所述解碼浮水印資訊用於表徵所述第一生成模型的描述資訊。
在一實施例中,所述鑒別單元42,還用於將所述待檢測多媒體內容進行頻域轉換,得到頻域待檢測多媒體內容;通過預設頻域濾波器,提取所述頻域待檢測多媒體內容中預設頻域的分量資訊,並將所述預設頻域的分量資訊作為所述待檢測多媒體內容的頻域浮水印資訊;對所述頻域浮水印資訊進行時域轉換,得到所述浮水印資訊。
在一實施例中,所述鑒別單元42,還用於確定所述待檢測多媒體內容中目標選定區域的預設數量個目標內容資訊;所述內容資訊包括以下至少一種:圖元資訊、亮度資訊、座標資訊、密度資訊;所述預設數量與所述浮水印資訊的位元數相同;將所述預設數量個內容資訊中的最低有效位元對應的資訊,作為所標浮水印資訊。
在一實施例中,所述鑒別模型的注釋資訊包含所述第一生成模型的描述資訊;所述鑒別單元42,還用於在所述浮水印鑒別結果表徵所述待檢測多媒體內容為所述第一生成模型生成的情況下,從所述注釋資訊中提取所述目標描述資訊。
需要說明的是,本申請實施例中的發射機和接收接對模組或單元的劃分是示意性的,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式。另外,在本申請各個實施例中的各功能單元可以集成在一個處理單元中,也可以是單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以採用硬體的形式實現,也可以採用軟體功能單元的形式實現。也可以採用軟體和硬體結合的形式實現。
需要說明的是,本申請實施例中,如果以軟體功能模組的形式實現上述的方法,並作為獨立的產品銷售或使用時,也可以儲存在一個電腦可讀取儲存媒體中。基於這樣的理解,本申請實施例的技術方案本質上或者說對相關技術做出貢獻的部分可以以軟體產品的形式體現出來,該電腦軟體產品儲存在一個儲存媒體中,包括若干指令用以使得電子設備執行本申請各個實施例所述方法的全部或部分。而前述的儲存媒體包括:隨身碟、移動硬碟、唯讀記憶體(Read Only Memory,ROM)、磁碟或者光碟等各種可以儲存程式碼的媒體。這樣,本申請實施例不限制於任何特定的硬體和軟體結合。
圖13為本申請實施例提供的一種可選的電子設備的結構示意圖,如圖13所示,電子設備50包括記憶體51和處理器52,其中,記憶體51,用於儲存可執行指令;處理器52,用於執行所述記憶體中儲存的可執行指令時,實現如上所述的浮水印添加方法;或者,實現如上所述的浮水印鑒別方法。
可以理解,本申請實施例中的記憶體可以是易失性記憶體或非易失性記憶體,或可包括易失性和非易失性記憶體兩者。其中,非易失性記憶體可以是唯讀記憶體(Read-Only Memory,ROM)、可程式設計唯讀記憶體(Programmable ROM,PROM)、可擦除可程式設計唯讀記憶體(Erasable PROM,EPROM)、電可擦除可程式設計唯讀記憶體(Electrically EPROM,EEPROM)或快閃記憶體。易失性記憶體可以是隨機存取記憶體(Random Access Memory,RAM),其用作外部快取記憶體。通過示例性但不是限制性說明,許多形式的RAM可用,例如靜態隨機存取記憶體(Static RAM,SRAM)、動態隨機存取記憶體(Dynamic RAM,DRAM)、同步動態隨機存取記憶體(Synchronous DRAM,SDRAM)、雙倍數據速率同步動態隨機存取記憶體(Double Data Rate SDRAM,DDRSDRAM)、增強型同步動態隨機存取記憶體(Enhanced SDRAM,ESDRAM)、同步連接動態隨機存取記憶體(Synchlink DRAM,SLDRAM)和直接記憶體匯流排隨機存取記憶體(Direct Rambus RAM,DRRAM)。本申請描述的系統和方法的記憶體旨在包括但不限於這些和任意其它適合類型的記憶體。
而處理器可能是一種積體電路晶片,具有信號的處理能力。在實現過程中,上述方法的各步驟可以通過處理器中的硬體的集成邏輯電路或者軟體形式的指令完成。上述的處理器可以是通用處理器、數位訊號處理器(Digital Signal Processor,DSP)、專用積體電路(Application Specific Integrated Circuit,ASIC)、現成可程式設計閘陣列(Field Programmable Gate Array,FPGA)或者其他可程式設計邏輯器件、分立門或者電晶體邏輯器件、分立硬體元件。可以實現或者執行本申請實施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。結合本申請實施例所公開的方法的步驟可以直接體現為硬體解碼處理器執行完成,或者用解碼處理器中的硬體及軟體模組組合執行完成。軟體模組可以位於隨機記憶體,快閃記憶體、唯讀記憶體,可程式設計唯讀記憶體或者電可讀寫可程式設計記憶體、寄存器等本領域成熟的儲存媒體中。該儲存媒體位於記憶體,處理器讀取記憶體中的資訊,結合其硬體完成上述方法的步驟。
可以理解的是,本申請描述的這些實施例可以用硬體、軟體、固件、中介軟體、微碼或其組合來實現。對於硬體實現,處理單元可以實現在一個或多個專用積體電路(Application Specific Integrated Circuits,ASIC)、數位訊號處理器(Digital Signal Processing,DSP)、數位信號處理設備(DSP Device,DSPD)、可程式設計邏輯裝置(Programmable Logic Device,PLD)、現場可程式設計閘陣列(Field-Programmable Gate Array,FPGA)、通用處理器、控制器、微控制器、微處理器、用於執行本申請所述功能的其它電子單元或其組合中。對於軟體實現,可通過執行本申請所述功能的模組(例如過程、函數等)來實現本申請所述的技術。軟體代碼可儲存在記憶體中並通過處理器執行。記憶體可以在處理器中或在處理器外部實現。
本申請實施例提供了一種電腦儲存媒體,所述儲存媒體儲存有可執行指令,當所述可執行指令被執行時,用於引起處理器執行如上述一個或多個實施例所述的浮水印添加或浮水印鑒別方法。
本申請實施例提供了一種包含指令的電腦程式產品,當其在電腦上運行時,使得電腦執行上述方法實施例提供的浮水印添加或浮水印鑒別中的步驟。
本領域內的技術人員應明白,本申請的實施例可提供為方法、系統、或電腦程式產品。因此,本申請可採用硬體實施例、軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本申請可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存媒體(包括但不限於磁碟記憶體和光學記憶體等)上實施的電腦程式產品的形式。
這裡需要指出的是:以上儲存媒體和設備實施例的描述,與上述方法實施例的描述是類似的,具有同方法實施例相似的有益效果。對於本申請儲存媒體、儲存媒體和設備實施例中未披露的技術細節,請參照本申請方法實施例的描述而理解。
應理解,說明書通篇中提到的“一個實施例”或“一實施例”或“一些實施例”意味著與實施例有關的特定特徵、結構或特性包括在本申請的至少一個實施例中。因此,在整個說明書各處出現的“在一個實施例中”或“在一實施例中”或“在一些實施例中”未必一定指相同的實施例。此外,這些特定的特徵、結構或特性可以任意適合的方式結合在一個或多個實施例中。應理解,在本申請的各種實施例中,上述各過程的序號的大小並不意味著執行順序的先後,各過程的執行順序應以其功能和內在邏輯確定,而不應對本申請實施例的實施過程構成任何限定。上述本申請實施例序號僅僅為了描述,不代表實施例的優劣。上文對各個實施例的描述傾向於強調各個實施例之間的不同之處,其相同或相似之處可以互相參考,為了簡潔,本申請實施例不再贅述。
本申請實施例中術語“和/或”,僅僅是一種描述關聯物件的關聯關係,表示可以存在三種關係,例如物件A和/或物件B,可以表示:單獨存在物件A,同時存在物件A和物件B,單獨存在物件B這三種情況。
需要說明的是,在本申請實施例中,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,並不排除在包括該要素的過程、方法、物品或者設備中還存在另外的相同要素。
在本申請所提供的幾個實施例中,應該理解到,所揭露的設備和方法,可以通過其它的方式實現。以上所描述的實施例僅僅是示意性的,例如,所述模組的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,如:多個模組或元件可以結合,或可以集成到另一個系統,或一些特徵可以忽略,或不執行。另外,所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過一些介面,設備或模組的間接耦合或通信連接,可以是電性的、機械的或其它形式的。
上述作為分離部件說明的模組可以是、或也可以不是物理上分開的,作為模組顯示的部件可以是、或也可以不是物理模組;既可以位於一個地方,也可以分佈到多個網路單元上;可以根據實際的需要選擇其中的部分或全部模組來實現本實施例方案的目的。
另外,在本申請各實施例中的各功能模組可以全部集成在一個處理單元中,也可以是各模組分別單獨作為一個單元,也可以兩個或兩個以上模組集成在一個單元中;上述集成的模組既可以採用硬體的形式實現,也可以採用硬體加軟體功能單元的形式實現。
或者,本申請上述集成的單元如果以軟體功能模組的形式實現並作為獨立的產品銷售或使用時,也可以儲存在一個電腦可讀取儲存媒體中。基於這樣的理解,本申請實施例的技術方案本質上或者說對相關技術做出貢獻的部分可以以軟體產品的形式體現出來,該電腦軟體產品儲存在一個儲存媒體中,包括若干指令用以使得電子設備執行本申請各個實施例所述方法的全部或部分。而前述的儲存媒體包括:移動存放裝置、ROM、磁碟或者光碟等各種可以儲存程式碼的媒體。
本申請所提供的幾個方法實施例中所揭露的方法,在不衝突的情況下可以任意組合,得到新的方法實施例。
本申請所提供的幾個產品實施例中所揭露的特徵,在不衝突的情況下可以任意組合,得到新的產品實施例。
本申請所提供的幾個方法或設備實施例中所揭露的特徵,在不衝突的情況下可以任意組合,得到新的方法實施例或設備實施例。
雖然本案已以實施方式揭示如上,然其並非用以限定本案,任何熟習此技藝者,在不脫離本案之精神和範圍內,當可作各種之更動與潤飾,因此本案之保護範圍當視後附之申請專利範圍所界定者為準。
10:浮水印添加裝置
11:第一獲取單元
12:第一生成單元
20:浮水印添加裝置
21:第二獲取單元
22:第二生成單元
30:浮水印添加裝置
31:第三獲取單元
32:第三生成單元
33:編碼單元
34:嵌入單元
40:浮水印鑒別裝置
41:第四獲取單元
42:鑒別單元
50:電子設備
51:記憶體
52:處理器
S101-S106、S301-S305、S701-S702:步驟
此處的附圖被併入說明書中並構成本說明書的一部分,這些附圖示出了符合本發明的實施例,並與說明書一起用於說明本發明實施例的技術方案。附圖中所示的流程圖僅是示例性說明,不是必須包括所有的內容和操作/步驟,也不是必須按所描述的循序執行。例如,有的操作/步驟還可以分解,而有的操作/步驟可以合併或部分合併,因此實際執行的順序有可能根據實際情況改變。
圖1為本申請實施例提供的一種可選的浮水印添加方法的流程示意圖一;
圖2為本申請實施例提供的一種可選的浮水印添加方法的流程示意圖二;
圖3為本申請實施例提供的一種可選的模型訓練過程的流程示意圖一;
圖4為本申請實施例提供的一種可選的浮水印添加方法的流程示意圖三;
圖5為本申請實施例提供的一種可選的浮水印添加方法的流程示意圖四;
圖6為本申請實施例提供的一種可選的浮水印添加方法的流程示意圖五;
圖7為本申請實施例提供的一種可選的浮水印鑒別方法的流程示意圖;
圖8為本申請實施例提供的一種可選的模型訓練過程的流程示意圖二;
圖9為本申請實施例提供的一種可選的浮水印添加裝置的結構示意圖一;
圖10為本申請實施例提供的一種可選的浮水印添加裝置的結構示意圖二;
圖11為本申請實施例提供的一種可選的浮水印添加裝置的結構示意圖三;
圖12為本申請實施例提供的一種可選的浮水印鑒別裝置的結構示意圖;
圖13為本申請實施例提供的一種可選的電子設備的結構示意圖。
S101-S102:步驟
Claims (21)
- 一種浮水印添加方法,其中所述方法包括: 獲取待處理資訊;以及 將所述待處理資訊輸入至第一生成模型中,得到第一多媒體內容;所述第一多媒體內容包含預設浮水印資訊; 其中,所述第一生成模型與鑒別模型是聯合訓練得到的;所述鑒別模型用於鑒別多媒體內容是否為所述第一生成模型生成。
- 如請求項1所述的方法,其中所述方法還包括: 將文本資訊輸入至當前原始生成模型,得到當前多媒體內容; 將所述當前多媒體內容與對應的真值多媒體內容之間的內容差值,確定為當前生成損失; 將所述當前多媒體內容作為正樣本,與負樣本一起輸入當前鑒別模型,得到當前鑒別損失,所述負樣本為非第一生成模型生成的多媒體內容;以及 根據所述當前鑒別損失和所述當前生成損失,更新所述當前原始生成模型,得到所述第一生成模型。
- 如請求項2所述的方法,其中所述將所述當前多媒體內容作為正樣本,與負樣本一起輸入當前鑒別模型,得到當前鑒別損失,包括: 將所述當前多媒體內容作為正樣本,與負樣本一起輸入當前鑒別模型,得到針對所述正樣本的當前第一鑒別結果和針對所述負樣本的當前第二鑒別結果;以及 根據所述當前第一鑒別結果和所述當前第二鑒別結果確定當前鑒別損失。
- 如請求項2或3所述的方法,其中所述根據所述當前鑒別損失和所述當前生成損失,更新所述當前原始生成模型,得到所述第一生成模型,包括: 根據所述當前鑒別損失和所述當前生成損失,確定當前目標生成損失;以及 在所述當前目標生成損失小於或者等於目標生成損失閾值,或者當前生成更新次數大於或者等於最大生成次數的情況下,將所述當前原始生成模型作為所述第一生成模型;所述方法還包括: 在所述當前目標生成損失大於所述目標生成損失閾值的情況下,且所述當前生成更新次數小於所述最大生成次數的情況下,根據所述當前生成損失更新所述當前原始生成模型,得到更新後的原始生成模型。
- 如請求項2所述的方法,其中所述真值多媒體內容為帶有預設浮水印資訊的多媒體內容;所述方法還包括: 將文本資訊輸入至第二生成模型中,得到第二多媒體內容;以及 將預設浮水印資訊嵌入到所述第二多媒體內容中,得到所述真值多媒體內容。
- 如請求項1或5所述的方法,其中所述方法還包括: 獲取用於描述所述第一生成模型的描述資訊;以及 將所述描述資訊進行編碼,得到所述預設浮水印資訊。
- 如請求項5所述的方法,其中所述將預設浮水印資訊嵌入到所述第二多媒體內容中,得到所述真值多媒體內容,包括: 將所述預設浮水印資訊進行頻域轉換,得到第一頻域的頻域浮水印資訊; 對所述第二多媒體內容進行頻域轉換,得到第二頻域的頻域多媒體內容; 將所述頻域浮水印資訊與所述頻域多媒體內容進行頻域疊加,得到頻域多媒體內容;以及 對所述頻域多媒體內容進行時域轉換,得到所述真值多媒體內容;所述將預設浮水印資訊嵌入到所述第二多媒體內容中,得到所述真值多媒體內容,包括: 基於所述預設浮水印資訊,對所述第二多媒體內容中目標選定區域的內容資訊進行修改,得到所述真值多媒體內容; 所述內容資訊包括以下至少一種:圖元資訊、亮度資訊、座標資訊、密度資訊。
- 如請求項7所述的方法,其中所述目標選定區域的內容資訊包括預設數量個內容資訊;所述預設數量與所述預設浮水印資訊的位元數相同;所述基於所述預設浮水印資訊,對所述第二多媒體內容中目標選定區域的內容資訊進行修改,得到所述真值多媒體內容,包括: 將所述第二多媒體內容中所述預設數量個內容資訊中每個內容資訊的最低有效位元修改為對應的一位元預設浮水印資訊,得到修改後的第二多媒體內容;以及 將所述修改後的第二多媒體內容作為所述真值多媒體內容。
- 一種浮水印添加方法,其中包括: 獲取待處理資訊;以及 將所述待處理資訊輸入至第一生成模型中,得到第一多媒體內容,所述第一多媒體內容包含預設浮水印資訊;其中,所述第一生成模型是基於包含預設浮水印資訊的多媒體內容訓練得到的。
- 如請求項9所述的方法,其中所述方法還包括: 將文本資訊輸入至當前原始生成模型,得到當前多媒體內容; 將所述當前多媒體內容與對應的真值多媒體內容之間的內容差值,確定為當前生成損失;所述真值多媒體內容為帶有浮水印資訊的多媒體內容;以及 在所述當前生成損失小於或者等於生成損失閾值,或者當前生成更新次數大於或者等於最大生成次數的情況下,將所述當前原始生成模型作為所述第一生成模型,所述方法還包括: 在所述當前生成損失大於生成損失閾值的情況下,根據所述當前生成損失更新所述當前原始生成模型,得到更新後的原始生成模型。
- 如請求項10所述的方法,其中所述方法還包括: 將文本資訊輸入至第二生成模型中,得到第二多媒體內容; 將預設浮水印資訊嵌入到所述第二多媒體內容中,得到所述真值多媒體內容;以及 基於所述真值多媒體內容對原始生成模型進行訓練,得到所述第一生成模型。
- 如請求項9所述的方法,其中所述方法還包括: 獲取用於描述所述第一生成模型的描述資訊;以及 將所述描述資訊進行編碼,得到所述預設浮水印資訊。
- 如請求項11所述的方法,其中所述將預設浮水印資訊嵌入到所述第二多媒體內容中,得到所述真值多媒體內容,包括: 將所述浮水印資訊進行頻域轉換,得到頻域浮水印資訊; 對所述第二多媒體內容進行頻域轉換,得到頻域多媒體內容; 將所述頻域浮水印資訊與所述頻域多媒體內容進行頻域疊加,得到頻域真值多媒體內容;以及 對所述頻域多媒體內容進行時域轉換,得到所述真值多媒體內容, 所述將預設浮水印資訊嵌入到所述第二多媒體內容中,得到所述真值多媒體內容,包括: 基於所述預設浮水印資訊,對所述第二多媒體內容中目標選定區域的內容資訊進行修改,得到所述真值多媒體內容, 所述內容資訊包括以下至少一種:圖元資訊、亮度資訊、座標資訊、密度資訊。
- 如請求項13所述的方法,其中所述目標選定區域的內容資訊包括預設數量個內容資訊;所述預設數量與所述浮水印資訊的位元數相同;所述基於所述預設浮水印資訊,對所述第二多媒體內容中目標選定區域的內容資訊進行修改,得到所述真值多媒體內容,包括: 將所述第二多媒體內容中所述預設數量個內容資訊中每個內容資訊的最低有效位元修改為對應的一位元預設浮水印資訊,得到所述真值多媒體內容。
- 一種浮水印添加方法,其中包括: 獲取待處理資訊和用於描述第二生成模型的描述資訊; 將所述待處理資訊輸入至所述第二生成模型中,得到第二多媒體內容; 對所述描述資訊進行編碼處理,得到浮水印資訊;以及 將所述浮水印資訊嵌入到所述第二多媒體內容中,得到真值多媒體內容。
- 如請求項15所述的方法,其中所述將所述浮水印資訊嵌入到所述第二多媒體內容中,得到所述真值多媒體內容,包括: 將所述浮水印資訊進行頻域轉換,得到頻域浮水印資訊; 將所述第二多媒體內容進行頻域轉換,得到頻域多媒體內容;以及 將所述頻域浮水印資訊與所述頻域多媒體內容進行頻域疊加,得到所述真值多媒體內容,其中所述將所述浮水印資訊嵌入到所述第二多媒體內容中,得到所述真值多媒體內容,包括: 基於所述浮水印資訊,對所述第二多媒體內容中目標選定區域的內容資訊進行修改,得到所述真值多媒體內容;所述內容資訊包括以下至少一種:圖元資訊、亮度資訊、座標資訊、密度資訊。
- 如請求項16所述的方法,其中所述目標選定區域的內容資訊包括預設數量個內容資訊;所述預設數量與所述浮水印資訊的位元數相同;所述基於所述浮水印資訊,對所述第二多媒體內容中目標選定區域的內容資訊進行修改,得到所述真值多媒體內容,包括: 將所述第二多媒體內容中所述預設數量個內容資訊中每個內容資訊的最低有效位元修改為對應的一位元浮水印資訊,得到所述真值多媒體內容。
- 一種浮水印鑒別方法,其中包括: 獲取待檢測多媒體內容;以及 將所述待檢測多媒體內容輸入鑒別模型,得到浮水印鑒別結果,所述浮水印鑒別結果表徵所述待檢測多媒體內容是否為第一生成模型生成的;其中, 所述鑒別模型是將當前多媒體內容作為正樣本進行訓練得到的,所述當前多媒體內容為當前原始生成模型根據文本資訊生成的,訓練完成後的當前原始生成模型為第一生成模型,第一生成模型用於生成包含浮水印資訊的多媒體內容。
- 如請求項18所述的方法,其中所述方法還包括: 將正樣本與負樣本一起輸入當前鑒別模型,得到針對所述正樣本的當前第一鑒別結果和針對所述負樣本的當前第二鑒別結果,所述負樣本為非第一生成模型生成的多媒體內容; 根據所述當前第一鑒別結果和所述當前第二鑒別結果確定當前鑒別損失;以及 在所述當前鑒別損失小於或者等於鑒別損失閾值,或者當前鑒別更新次數大於或者等於最大鑒別次數的情況下,將所述當前鑒別模型作為所述鑒別模型,其中所述方法還包括: 在所述當前鑒別損失大於鑒別損失閾值的情況下,根據所述當前鑒別損失更新所述當前鑒別模型,得到更新後的鑒別模型。
- 一種電子設備,其中包括: 記憶體,用於儲存可執行指令;以及 處理器,用於執行所述記憶體中儲存的可執行指令時,實現上述的請求項1-8任一項所述的浮水印添加方法;或者,實現上述的請求項9-14任一項所述的浮水印添加方法;或者,實現上述的請求項15-17任一項所述的浮水印添加方法;或者,實現上述的請求項18-19任一項所述的浮水印鑒別方法。
- 一種電腦可讀儲存媒體,其中所述儲存媒體儲存有可執行指令,當所述可執行指令被執行時,實現上述的請求項1-8任一項所述的浮水印添加方法;或者,實現上述的請求項9-14任一項所述的浮水印添加方法;或者,實現上述的請求項15-17任一項所述的浮水印添加方法;或者,實現上述的請求項18-19任一項所述的浮水印鑒別方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN2023114937381 | 2023-11-09 | ||
| CN202311493738.1A CN117615075A (zh) | 2023-11-09 | 2023-11-09 | 水印添加及水印鉴别方法、装置、设备、可读存储介质 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| TW202520699A true TW202520699A (zh) | 2025-05-16 |
Family
ID=89952581
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW113143075A TW202520699A (zh) | 2023-11-09 | 2024-11-08 | 浮水印添加及浮水印鑒別方法、電子設備及電腦可讀儲存媒體 |
Country Status (3)
| Country | Link |
|---|---|
| CN (1) | CN117615075A (zh) |
| TW (1) | TW202520699A (zh) |
| WO (1) | WO2025098510A1 (zh) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117615075A (zh) * | 2023-11-09 | 2024-02-27 | 摩尔线程智能科技(上海)有限责任公司 | 水印添加及水印鉴别方法、装置、设备、可读存储介质 |
| CN120676105A (zh) * | 2024-03-18 | 2025-09-19 | 华为云计算技术有限公司 | 一种视频扩散模型水印嵌入方法和装置 |
| CN118282779B (zh) * | 2024-05-31 | 2024-07-26 | 杭州海康威视数字技术股份有限公司 | 基于神经网络的密态多媒体数据安全防御方法及装置 |
| CN118764566B (zh) * | 2024-06-24 | 2025-11-04 | 中国建设银行股份有限公司 | 一种电子印章加密系统、方法、装置、设备及介质 |
| CN119783067A (zh) * | 2024-11-22 | 2025-04-08 | 浙江天猫技术有限公司 | Ai生成内容的重置方法、设备、存储介质和程序产品 |
| CN119863352A (zh) * | 2024-12-30 | 2025-04-22 | 杭州萤石软件有限公司 | 图像生成模型训练方法、图像生成方法以及图像检测方法 |
| CN120259067B (zh) * | 2025-06-09 | 2025-09-23 | 北京泰尔英福科技有限公司 | 基于权重的神经网络水印方法、系统、装置及介质 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111311472B (zh) * | 2020-01-15 | 2023-03-28 | 中国科学技术大学 | 一种图像处理模型与图像处理算法的产权保护方法 |
| CN111737662A (zh) * | 2020-06-16 | 2020-10-02 | 北京达佳互联信息技术有限公司 | 水印添加方法、水印提取方法、装置、电子设备 |
| EP4256473A1 (en) * | 2021-03-24 | 2023-10-11 | Google LLC | Machine-learned models for imperceptible message watermarking in videos |
| CN114331791B (zh) * | 2021-10-12 | 2024-12-06 | 腾讯科技(深圳)有限公司 | 模型水印生成、模型侵权鉴定方法、装置和计算机设备 |
| CN117615075A (zh) * | 2023-11-09 | 2024-02-27 | 摩尔线程智能科技(上海)有限责任公司 | 水印添加及水印鉴别方法、装置、设备、可读存储介质 |
-
2023
- 2023-11-09 CN CN202311493738.1A patent/CN117615075A/zh active Pending
-
2024
- 2024-11-08 TW TW113143075A patent/TW202520699A/zh unknown
- 2024-11-11 WO PCT/CN2024/131273 patent/WO2025098510A1/zh active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| CN117615075A (zh) | 2024-02-27 |
| WO2025098510A1 (zh) | 2025-05-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TW202520699A (zh) | 浮水印添加及浮水印鑒別方法、電子設備及電腦可讀儲存媒體 | |
| Kumar et al. | A recent survey on multimedia and database watermarking | |
| Dittmann et al. | Content-based digital signature for motion pictures authentication and content-fragile watermarking | |
| CN113257259A (zh) | 基于神经网络的安全音频水印加注 | |
| Malanowska et al. | Digital watermarking—a meta-survey and techniques for fake news detection | |
| CN114419633B (zh) | 一种用于证件文档类图像篡改的检测方法和系统 | |
| CN117474741A (zh) | 一种基于人脸关键点水印的主动防御检测方法 | |
| CN119151766B (zh) | 一种基于椭圆曲线的半易碎扩散水印方法和系统 | |
| Sun et al. | Deep perceptual hash based on hash center for image copyright protection | |
| CN115482142A (zh) | 暗水印添加方法、提取方法、系统、存储介质及终端 | |
| Wu et al. | Reversible watermarking of 3D mesh models by prediction-error expansion | |
| Huang et al. | Geometrysticker: Enabling ownership claim of recolorized neural radiance fields | |
| Ding et al. | Image authentication and tamper localization based on relative difference between DCT coefficient and its estimated value | |
| Zamani et al. | Knots of substitution techniques of audio steganography | |
| Li et al. | Block mapping and dual-matrix-based watermarking for image authentication with self-recovery capability | |
| CN111754379B (zh) | 一种数字水印处理方法、装置及电子设备、存储介质 | |
| Du et al. | Image hashing for tamper detection with multiview embedding and perceptual saliency | |
| Fofanah et al. | Watermarking of frequency and steganography for protection of medical images based on bacterial foraging optimization and genetic algorithm | |
| Tsai | An efficient 3D information hiding algorithm based on sampling concepts | |
| CN119107219A (zh) | 一种对抗水印生成方法、装置、计算机设备及存储介质 | |
| Liu et al. | Perceptual image hashing based on Canny operator and tensor for copy-move forgery detection | |
| CN114630130A (zh) | 一种基于深度学习的换脸视频溯源方法及系统 | |
| Li et al. | A robust coverless image steganography algorithm based on image retrieval with SURF features | |
| Wöhnert et al. | A study on the use of perceptual hashing to detect manipulation of embedded messages in images | |
| CN113705806B (zh) | 用于数字水印的网络训练、编码和解码方法、装置及介质 |