Google теперь использует BERT для сопоставления историй с проверками фактов


Google внесла множество изменений в функции автозаполнения, новостей, проверки фактов, панелей знаний, обнаружения последних новостей и многого другого.

Google объявил и резюмированный множество изменений и обновлений, которые компания внесла в поиск Google за последний год. Это объявление касается изменений в Google Search, Google News, автозаполнении, проверке фактов с помощью BERT и языковой обработки.

На высоком уровне Google стремится предоставлять результаты поиска, которые не только максимально актуальны, но и максимально надежны. А в некоторых случаях, как в YMYL, ваши деньги, ваш сектор жизни, надежность – это более важная задача для Google, особенно в связи с приближающимися президентскими выборами в США и здоровьем во время пандемии.

Что изменилось? Панду Наяк, научный сотрудник Google и вице-президент Google Search, сказал, что сегодняшнее объявление было больше о текущих изменениях, которые Google внес за эти годы, а не о запуске нового продукта или функции. Вот последние настройки и изменения, которые компания выделила за последний год:

  • Автозаполнение изменений политики в отношении выборов, в частности, более консервативные и показывающие меньше против большего в этой области.
  • Google BERT используется в новостях с полным освещением, чтобы лучше согласовывать проверки фактов с историями.
  • В 2020 году этикетки для проверки фактов были показаны более 4 миллиардов раз.
  • Google тесно сотрудничает с Википедией, чтобы обнаруживать и устранять вандализм, который Google может использовать в панелях знаний.
  • Теперь Google может обнаруживать самые свежие новости за несколько минут, а не за 40+ минут.

BERT и полное покрытие. Google теперь использует BERT, одна из его языковых моделей ИИ, чтобы лучше понять, являются ли статьи в зоне полного охвата Новостей Google достоверными с точки зрения фактов в Интернете. Таким образом, Google в некотором смысле может видеть связи между статьями и базой данных проверки фактов, чтобы лучше согласовывать проверки фактов с историями. В некотором смысле поможет понять, связана ли проверка фактов с основной темой рассказов.

Панду написал: «Мы также только что запустили обновление, используя наши модели понимания языка BERT, чтобы улучшить соответствие между новостями и доступными проверками фактов. Эти системы могут лучше понять, связано ли утверждение о проверке фактов с центральной темой статьи, и выделить эти проверки фактов более заметно в Полном обзоре – новостной функции, которая дает полную картину того, как история сообщается из различных источников. . Одним касанием «Полное покрытие» позволяет вам видеть главные заголовки из разных источников, видео, местные новостные отчеты, часто задаваемые вопросы, комментарии в социальных сетях и хронологию для историй, которые разыгрываются с течением времени ».

Последние новости. Google заявила, что теперь может обнаруживать запросы с последними новостями в течение нескольких минут после выхода новости. Раньше это могло занять у Google более 40 минут. Подобные запросы последних новостей иногда приводили к неверной информации. Таким образом, теперь Google может намного быстрее обнаруживать запросы с последними новостями и, таким образом, использовать рычаг выбора типов сайтов, которые он хочет показывать для этих запросов на ранней стадии – в данном случае более авторитетные результаты, которые матч на EAT.

Вам следует ожидать от Google более точной и надежной информации по темам, которые вызывают самые свежие новости.

Автозаполнение изменений политики. Дэвид Графф, старший директор по вопросам доверия и безопасности в Google, сказал, что в отношении выборов, а также в отношении некоторых других областей, Google будет придерживаться более консервативного подхода к предложениям, отображаемым в автозаполнении. Google предпочитает не показывать предложение в автозаполнении, чем показывать неточное предложение. Таким образом, в отношении выборов и некоторых других областей Google может показывать меньше предложений, чем больше.

Панду пояснил, что Google «расширил политику автозаполнения, относящуюся к выборам, и мы удалим прогнозы, которые могут быть истолкованы как претензии за или против любого кандидата или политической партии». «Мы также удалим прогнозы, которые могут быть истолкованы как утверждения об участии в выборах – например, утверждения о методах голосования, требованиях или статусе мест для голосования – или о целостности или легитимности избирательных процессов, таких как безопасность выборов. ,” он объяснил. Один из примеров, приведенных Дэвидом Граффом, заключался в том, что запрос вроде [you can vote by mail by texas], если это правда или нет, может не отображаться. Одно важное замечание: «независимо от того, появится ли прогноз, вы все равно можете искать все, что хотите, и находить результаты», – объяснил Дэвид.

Ярлык проверки фактов показан 4 миллиарда раз. Google сказал, что пока в 2020 году этикетка для проверки фактов был показан в поиске более 4 миллиардов раз. Google сказал, что это уже больше, чем то, сколько раз Google показывал этот ярлык проверки фактов за весь 2019 год. За последние несколько лет Google расширил этот ярлык на новости, поиск, изображения и другие области.

Граф знаний и Википедия. Google много инвестирует вместе с Википедией, чтобы обнаружить и уменьшить вандализм в Википедии. поскольку Google очень часто использует Википедию для своих панелей знаний и избранные фрагменты, у Google есть стимул обеспечить надежность и точность этих записей в Википедии. По словам Google, большинство проблем в Википедии исправляются в течение нескольких минут.

«В дополнение к системам Википедии мы добавили дополнительные системы защиты и обнаружения, чтобы предотвратить появление потенциально неточной информации на панелях знаний. В редких случаях в Википедии могут проскользнуть случаи вандализма. Лишь небольшая часть правок из Википедии является потенциальным вандализмом, и мы улучшили наши системы, чтобы теперь обнаруживать 99 процентов таких случаев. Если эти проблемы действительно возникают, у нас есть политики, которые позволяют нам быстро принять меры для их решения. Для дальнейшей поддержки сообщества Википедии в прошлом году мы создали программу WikiLoop, в которой размещены несколько инструментов редактирования, ориентированных на качество контента. Сюда входит WikiLoop DoubleCheck, один из множества инструментов, которые редакторы Википедии и пользователи могут использовать для отслеживания изменений на странице и отметки потенциальных проблем. Мы предоставляем данные из наших собственных систем обнаружения, которые члены сообщества могут использовать для получения новых сведений », – написал Google.

Рейтеры и рекомендации по качеству поиска. Google объяснил, что многие тесты и критерии перечислены в его Рекомендации для оценщиков качества поиска. Google четко документирует свои цели для результатов поиска, для каких типов запросов требуется более высокий уровень авторитетных и надежных источников, а для каких – нет. Фактически, Панду объяснил, что Google обучает свои классификаторы запросов, чтобы понимать, относится ли запрос к категории YMYL (мы знаем это). Поэтому, когда возникают новые проблемы, системы Google готовы обрабатывать эти запросы, сказал он.

Чтобы понять, что является надежным, особенно в области здравоохранения и выборов. Google должен был определить, что является надежным и качественным, непосредственно их рекомендации оценщиков качества поиска. Google использует отзывы о рекомендациях экспертов по оценке качества и вводит их в модели машинного обучения, чтобы отправить их своим инженерам для улучшения поиска в целом. Опять же, Google не использует этих оценщиков непосредственно в поиске и эти рейтинги, чтобы напрямую не влиять на поисковый рейтинг отдельных запросов или сайтов.

У Google более 10 000 оценщиков по всему миру, в том числе по одному в каждом штате, чтобы получить репрезентативное представление обо всех поисковиках. Эти оценщики оценивают результаты поиска на основе этих рекомендаций оценщиков качества. Рейтеры смотрят на параллельные эксперименты. Google провел более 60 000 параллельных экспериментов и почти 400 000 тестов качества поиска, из них более 1 миллиона за последние четыре года, то есть около 1000 тестов в день.

Почему нам не все равно. Google постоянно настраивает поиск Google, чтобы улучшить качество, релевантность, надежность и точность поиска. Это означает, что вам необходимо постоянно улучшать свой веб-сайт, чтобы обеспечить высочайшее качество, более актуальный, надежный и точный контент и удобство для пользователей.

Ничего особенного не меняется сегодня с поиском Google, но подумайте об этих изменениях в долгосрочной перспективе и продолжайте улучшать свой веб-сайт.