超級劇透季四: 強監管時代,音視頻內容安全審核系統需要具備哪些能力?
發表時間:2021-12-03
返回列表幾年前,思科曾經預測,音視頻資源將在2022年占據所有互聯網流量的82%。時至今日,預測逐漸成真。
《2021中國網絡視聽發展研究報告》顯示,截至2020年12月,我國網絡視聽用戶規模達9.44億,泛網絡視聽產業規模達6009.1億。各類互聯網音視頻每天以超過100億小時/天的增量在增長。
沒人能否認,直播短視頻行業的興起帶火了音視頻內容的大發展。站在時代的大風口上,各類UP主、KOL、創作達人們,不論是PGC還是UGC,但凡有點內容輸出能力的,沒誰不是爭先恐后、挖空心思要搶占流量制高點。誰都明白,在這個流量為王的時代,有它就代表一切。
對于網絡音視頻內容創作的空前繁榮,就像魔鏡的兩面,讓人喜憂參半。一方面優秀的作品為用戶帶來大波內容豐富、形式新穎的音視頻佳作,另一方面,那些扮丑作妖、內容惡俗、暴力血腥甚至觸碰法律底線的網絡垃圾,也大量充斥在網絡空間,成為危害人民、甚至動搖國家安全的毒瘤。
凈網行動,勢在必行
對各大平臺而言,圖文音視頻內容創作野蠻生長的時代早已結束,監管政策趨嚴是大勢所趨,內容安全審核風控的成敗已成為卡住平臺生死命門的達摩克里斯之劍,稍有不慎,就會陷入萬劫不復的境地。
舉個最典型的例子,內涵段子,這個曾擁有2.5億高粘性用戶的熱門APP,曾經風光無限,但因導向不正、格調低俗等突出問題,被勒令永久下架,徹底涼涼。實際上,抖音、快手、西瓜視頻......,幾乎所有的網絡直播和短視頻平臺,都曾因為內容安全問題被約談整改。
這樣的形式下,就不難解釋,為什么頭部平臺全都不遺余力,強力推行內容安全審核制度,不斷完善運營審核隊伍了。
目前,不論是采用先審后發還是先發后審機制,各大平臺都離不開機器審核+人工審核這兩個關鍵要素。其中,機器審核作為初篩,對海量數據進行快速審核,劃定可疑范圍。其特點優勢在于覆蓋廣、標準統一、速度快、迭代更新能力強,結合人工復審,雙管齊下,可以做到真正意義上的實時在線審核。
強監管環境下,內容安全機器審核系統需要具備哪些能力?
從產業趨勢上看,不同媒體形式的交叉融合正在加快,越來越多的垂直行業也開始參與視聽內容的輸出,泛媒體化泛娛樂化正在成為共識。更多樣化的媒體形式,更快速實時的互動方式和更錯綜復雜的海量內容,給音視頻內容安全監管帶來了前所未有的壓力。作為內容安全審核的絕對主力,這些變化要求機器審核系統必須走向智能化、高效化、可擴展和自主可控化。
- 算法智能化
傳統的內容識別技術以關鍵字和特征庫為代表,以圖像處理為例,傳統識別方式通過人工設計圖像處理算法,完成圖像的分析處理。比較具有代表性算法包括均值濾波、圖像金字塔、sobel邊緣檢測算子、LBP算子、sift算法,圖像線性插值算法等。這些算法常用于圖像的縮放、增強、邊緣檢測、圖像匹配等方向。主要優點是可解析,穩定性好。但缺點也很明顯,傳統方法無法提取圖片中豐富的視覺特征,實現更高層次的語義識別,并且泛化能力差,無法適應豐富多變的應用場景,因此會帶來比較大的安全風險和后續人力投入。
要想改善這一結果,必須采用基于自然語言處理、深度學習技術的智能識別技術,通過大量的訓練數據積累,規則的不間斷更替迭代,持續的工程化開發支持,提升識別率,保證對圖片、語音、視頻風險監測識別的全覆蓋。
- 處理高效化
在直播短視頻領域,為取得更好的實時互動效果,平臺不僅要盡可能的保障風險和安全,效率和速度也很重要。通常,直播領域會要求畫面播出前完成機器審核,直播一般會有數秒的延遲。由于每天新產生的內容量巨大,縮短延遲時間,提升機器審核的處理效率,是對機器審核系統提出的巨大性能挑戰。
- 系統可擴展和自主可控化
對數據無法開放,只能在本地存儲內容的平臺而言,隨著數據量的提升,對系統可擴展性和自主可控性的要求勢必會提上日程。強大的平臺升級和系統彈性伸縮能力可以大量減少重復成本支出,提升ROI投資回報率。
AVA(audio video analyst)音視頻內容安全審核一體化解決方案
恒揚數據結合自身在芯片設計及應用,硬件系統開發和軟件算法工程化上的能力,為自建內容安全審核系統的客戶提供了高效智能審核方案AVA(audio video analyst),對互聯網音視頻圖像進行內容合規性審核和關鍵目標識別,以圖像、視頻音頻為目標進行檢索,實現場景審核檢測,提升平臺抗風險能力,保障高質量內容輸出。目前,AVA已經開發出人臉識別、視頻檢索、鑒黃、臺標識別四大功能模塊。
- 神經網絡算法,提升系統智能化
AVA音視頻智能內容安全審核方案采用軟硬協同的一體化方案,軟件方面,AVA采用卷積神經網絡算法,通過大量的數據訓練擬合出最理想的神經網絡,利用計算損失函數反向傳播不斷優化卷積核,最終損失函數收斂,其原理是卷積核對圖像數據進行特征提取,不同的卷積核提取不同的特征,如邊緣、紋理、顏色空間等特征信息,卷積層越深,提取的特征越抽象,最終實現的推理結果越精準。
經過神經網絡算法的圖像處理,數據的特征匯聚形成多維信息向量,多維信息構建出索引后可以按照向量對目標進行搜索。對同一目標的搜索匹配出多個結果,按照序列進行匹配,并在多個結果中選擇最優解。
目前,AVA智能內容安全審核方案識別準確率可達到99%,召回率大于95%,系統具備魯棒性強,能識別遮擋、光照變化、表情變化、側臉等各種復雜情況下的人臉,細粒度對色情和性感內容進行分類識別。同時,系統自帶抗干擾功能,可抵抗視頻分辨率變化、畫面裁剪、片段拼接、灰度變換、加水印、加黑邊、加文字、重編碼、色彩飽和度變換等變形攻擊。
- 硬件加速引擎推升處理性能
硬件方面,AVA通過服務器配置硬件加速卡的方式,實現圖像處理加速和神經網絡加速。當視頻被解析成圖像后,圖像的縮放、裁剪等處理,都由硬件加速卡完成。處理后的數據采用神經網絡算法進行識別處理,形成數據的關聯圖譜。
AVA系統單臺整機可同時分析300-400路1080P視頻,單機支持上萬長視頻底庫,同時并發480路 1080P視頻的實時分析,可并發處理2Gbps的音視頻流量。
- 模塊化設計+國產化硬件,助力系統可伸縮彈性和自主可控化
根據不同客戶需要,AVA提供模塊化設計,系統可依據性能、識別要求等進行個性化配置。在關鍵算法上,AVA兼容自研加速卡、國產寒武紀MLU加速卡、華為昇騰Atlas加速卡等多種方式,通過國產自主硬件加速卡快速實現視頻高速解碼和神經網絡加速,對圖像、視頻片段、圖/幀內關鍵目標進行搜索分析及合規性檢測。