Deepmind представила AlphaGeometry – модель, решающую геометрические задачи на уровне победителей Международной математической олимпиады. AlphaGeometry решила 25 из 30 задач олимпиады, в то время как в среднем победители олимпиады решают 25.9 задач, а предыдущая модель – только 10.
Существующие языковые модели часто неспособны решать сложные математические задачи из-за нехватки обучающих данных и неспособности генерировать свободные от ошибок длинные логические цепочки. AlphaGeometry при решении задач сочетает метод дедукции, основанный на законах геометрии, и выполнение дополнительных геометрических построений, которые с наибольшей вероятностью приведут к ответу.
На основе геометрического рисунка задачи и ее условия модель выводит новые утверждения о взаимосвязи между объектами до тех пор, пока не решит задачу. Если решение не найдено, AlphaGeometry выполняет дополнительное построение и на его основе формирует новые утверждения. Этот цикл продолжается до тех пор, пока не будет найдено решение.
Для обучения модели было сгенерировано около миллиарда случайных геометрических рисунков и сформированы все взаимосвязи между объектами на них. Затем модель обучалась понимать, какие дополнительные построения позволили найти взаимосвязь между каждой парой объектов. Такой подход в DeepMind назвали «обратной трассировкой». После фильтрации похожих рисунков осталось 100 миллионов примеров с размеченными соотношениями между объектами. Таким образом, для обучения модели использовались только синтетические данные без реальных геометрических задач.
Код AlphaGeometry опубликован в открытом доступе.
У меня тока вопрос где сайт етой нейронки