Какова минимальная информация, необходимая для описания чего-либо? Чтобы точно определить любое место на Земле, требуется всего два числа, а именно его долгота и широта. Для создания любого оттенка цвета с использованием стандарта RGB требуется три числа. А знаменитая идея «шести степеней разделения» предполагает, что нам нужно всего шесть социальных контактов, чтобы связаться с любым человеком на планете.

Но все эти примеры относятся к прямой информации. Все становится более нечетким, когда мы имеем дело с величинами, которые являются косвенными, т.е. которые нельзя указать в точном местоположении, но которые появляются только после суммирования или усреднения по многим локальным экземплярам. Например: какой минимальный объем информации необходим для распознавания человеческого лица? Это вопрос, который актуален как для портретиста, так и для программного обеспечения для распознавания лиц. Конечно, мы могли бы просто сделать снимок и сохранить все пиксели, но, конечно же, это избыточная информация. Мы можем распознавать черты лица и на черно-белых фотографиях. А иногда мы узнаем людей только по глазам — особенно в эти времена covid-19, когда все носят маски.

Еще одна область, где этот вопрос актуален, — топология. Топологические материалы обладают причудливыми свойствами — например, проводя по краям, оставаясь при этом изолирующими в объеме (см. видео об этом, которое я подготовил для Кембриджского научного фестиваля). Эти свойства могут быть связаны с различной топологией их электронной зонной структуры, которую можно суммировать топологическим числом или инвариантом. Этот инвариант является очень нелокальной величиной. Он рассчитывается путем интегрирования функции кривизны по всему импульсному пространству. В трехмерных системах или при рассмотрении взаимодействий, которые добавляют другие измерения к вычислению инварианта, получение полного топологического инварианта может стать очень громоздким. Кроме того, очень часто функция кривизны является довольно локализованным объектом: она сильно выражена в определенных точках с высокой симметрией, в то время как где-либо еще она пренебрежимо мала. Таким образом, кажется, что нам действительно не нужно выполнять полное интегрирование для приближенного вычисления топологических инвариантов.

Это естественно вызывает вопрос о том, какова минимальная информация, необходимая для извлечения топологических инвариантов. В нашей статье SciPost мы рассмотрели именно этот вопрос в контексте топологических изоляторов, использующих возможности машинного обучения. Мы обнаружили, что достаточно использовать только значение функции кривизны в точках высокой симметрии в качестве входных данных, чтобы определить топологический инвариант и правильно очертить топологическую фазовую диаграмму различных топологических изоляторов в 1D и 2D. На этих данных мы можем обучить простую нейронную сеть, и она автоматически научится распознавать различные топологические фазы.

Алгоритм машинного обучения также может пойти еще дальше. Мы можем обучить нейронную сеть с данными из невзаимодействующих топологических изоляторов (с которыми обычно гораздо проще обращаться), а затем применить обученную машину к взаимодействующим топологическим изоляторам. Несмотря на наличие взаимодействий и более сложную форму функции кривизны, алгоритм по-прежнему способен корректно идентифицировать все топологические фазы и фазовые переходы со значительным ускорением времени вычислений. Это ускорение позволило нам исследовать большее пространство параметров и обнаружить новые результаты, такие как появление мультикритичности, вызванной взаимодействиями.

Итак, в этом случае кажется, что минимальная информация, необходимая для описания топологических изоляторов, — это всего лишь одно число в каждой точке высокой симметрии.