- Сообщения
- 4.590
- Реакции
- 5.049
Темная Сеть, известная также как Dark Web - это скрытый сегмент Интернета. Доступна только через анонимные программы, такие как Tor. Здесь нарушаются законы, включая продажу запрещённых веществ, оружия, поддельных документов и услуги хакеров.
Южнокорейские ученые разработали ИИ DarkBERT, который использует архитектуру RoBERTa для извлечения полезных данных из текстов в Темной Сети. Модель RoBERTa была создана в 2019 году и является одним из самых эффективных методов улучшения естественного языка.
Ученые создали базу данных из текстов Темной Сети, используя сеть Tor. Очистили устаревшие и повторяющиеся элементы и обучили модель RoBERTa LLM на этой базе данных. Теперь модель способна анализировать тексты из Темной Сети и выделять главные элементы.
DarkBERT превосходит другие языковые модели в анализе текстов с Темной Сети, что поможет выслеживать Интернет-преступников. Тем не менее, для этой модели требуется дополнительное обучение и настройка. Кроме того, пока остается неясным, какую полезную информацию она может предоставить и как ее можно использовать.