內容篩選指的是使用自動系統來處理大量資料,並對符合某些條件的任何內容採取行動。發佈商通常會使用文字和媒體篩選解決方案,處理站上大量的使用者產生內容。這類系統的常見用途是篩選特定內容,例如分享成人及違法檔案,以及銷售槍枝、毒品、酒精飲料和菸草。
開發內部解決方案
許多發布商都選擇自行開發篩選系統,這種做法的好處如下:
- 文字篩選系統的編碼相對來說較容易
- 費用通常比商業解決方案低廉
- 發布商最瞭解本身網站和使用者,而且比任何人更能預測政策問題
建立關鍵字清單
- 將您想要篩選的文字和詞組列成清單。您可以憑直覺加入字詞,也可以透過其他資源尋找靈感:
- 由員工集思廣益
- 向使用者尋求協助
- 使用 Google Ads 的關鍵字規劃工具
- 如需更多靈感,您也可以查看代管不適宜內容的網站 (例如成人及/或檔案分享網站),瞭解這些網站上經常出現哪些關鍵字。
- 編寫自動關鍵字抓取工具的程式碼:
- 使用搜尋引擎資料瀏覽站上所有網頁
- 在站上擷取個別文字和文字組合的清單
- 保留最常用的關鍵字並移除其他關鍵字。別忘了剔除「a」、「and」或「the」等常見冠詞和單字。
- 存成文字檔案
- 對任意數量的網站重複上述步驟,直到您認為清單沒問題為止,這樣就大功告成了。
- 重要事項:抓取其他網站並將其內容做為己用,這不但違反《Google 發布商政策》以及 Google 網頁搜尋的垃圾內容政策,還可能違法且/或違反道德。
字詞並非生而平等,有些關鍵字可能比其他關鍵字更不適宜。因此,建議您對不同字詞指定不同權重。
舉例來說,英文版成人篩選器對「porno」(色情) 這個字的權重應高於「sex」(性)。「porno」幾乎專指非闔家適用內容,但「sex」根據上下文也可能是指「性別」。
此外,您還可想想本身沒有問題,但與其他字眼組合後可能另有所指的詞。舉例來說,「圖片」這個詞本身並無不妥,但「幼齒圖片」通常與色情有關。
方法 1 - 掃描網頁上顯示的使用者自製內容:
- 掃描內容
- 標記符合篩選條件的內容
- 在代管這類內容的網頁上暫停放送廣告
- 手動審核內容:
- 如果內容安全,則恢復放送廣告並調整篩選器
- 如果內容不安全,則確認內容未顯示在包含廣告程式碼的網頁上
方法 2 - 向他人顯示使用者自製內容前先進行掃描:
- 掃描內容
- 標記符合篩選條件的內容
- 排定審核或直接拒絕
- 手動審核內容:
- 如果內容安全,在廣告放送網頁上顯示內容並調整篩選器
- 如果內容不安全,停用廣告放送並顯示或拒絕內容
商業解決方案概述
有些服務可提供內容篩選功能,也有些服務專門篩選成人或版權等類型的內容。此外,對於希望上網輕鬆致富的發佈商和使用者,有些群眾外包平台也在兩者之間搭起橋樑。做決定時,最好的方法就是針對主題進行市場研究,據此判斷哪一種解決方案最適合您提供的服務。建議您搜尋軟體評論網站,瞭解哪幾種使用者產生內容篩選系統深受推薦。一手掌握這些資訊後,您就能根據產品的分數、獨特功能以及定價模式來決定最適合的解決方案。