雅虎發(fā)布AI識別語言暴力技術(shù),識別率達到90%
雅虎的研究人員近日發(fā)表了一個通過機器學(xué)習(xí)和自然語言處理,技術(shù)識別網(wǎng)絡(luò)語言暴力的技術(shù)。雅虎的算法通過不斷識別暴力語言中字母之間的關(guān)系來自我學(xué)習(xí),使其解決不規(guī)則的拼寫問題。算法還會參考語句長度、大寫字母應(yīng)用、標點符號這些語法因素,甚至一些涉及相關(guān)性的高級語法特征也被考慮進去。研究人員發(fā)現(xiàn),目前的系統(tǒng)最好的情況下,機器的結(jié)果可以達到與人工結(jié)果有90%的重合度。研究人員表示,他們很快會通過雅虎Webscope公布他們的數(shù)據(jù)庫,不過遺憾的是,這一數(shù)據(jù)庫只可以用于非商業(yè)用途的研究。


























粵公網(wǎng)安備 44030402000745號