«Мышечный пароль»: ученые МФТИ создали эталон для распознавания жестов
Ученые Московского физико-технического института (МФТИ) разработали бенчмарк — эталон для оценки компьютерных программ, распознающих жесты по сигналам электромиографии (ЭМГ). С его помощью они сравнили более десяти популярных нейросетей и классических алгоритмов. Результаты показали ограничения современных моделей, но открывают путь к адаптивным системам, которые смогут понимать «немые команды» любого человека.
Электромиография — метод регистрации электрической активности мышц во время их сокращения. С помощью датчиков и электродов система улавливает сигналы, например, от мышц предплечья, когда человек шевелит пальцами. Затем программа преобразует их в команды для устройств: протезов, дронов, систем виртуальной или дополненной реальности.
«Преимущества метода в том, что регистрирующие датчики вплотную прилегают к телу, — объясняет студент 6-го курса МФТИ Кирилл Головань, один из создателей бенчмарка. — В отличие от камер, лидаров или систем отслеживания взгляда, ЭМГ-устройства успешно работают в темноте, не требуют прямой видимости и не страдают от перекрытий одеждой. К тому же они обеспечивают высокую разрешающую способность, позволяя улавливать мельчайшие движения мышц».
Проблема «мышечного почерка»
Современные нейросетевые алгоритмы играют ключевую роль в превращении мышечной активности в понятные команды. Однако предложенный бенчмарк показал: без предварительной калибровки ни одна из протестированных моделей не смогла одинаково точно распознавать жесты разных людей. Причина — в биологической уникальности каждого человека.
В ходе эксперимента исследователи обучили модели на данных одной группы, а затем проверили их на незнакомом испытуемом. Лучшие программы продемонстрировали точность около 35%. Причем статистически значимой разницы между нейросетевыми и классическими подходами не обнаружилось. Работа опубликована в сборнике 2026 28th International Conference on Digital Signal Processing and its Applications (DSPA).
Главным препятствием стала межсубъектная вариативность: сигнал одного и того же жеста у разных людей отличается сильнее, чем модель способна обобщить. Например, при одинаковых задачах активность мышц предплечья у женщин в 1,3–2,8 раза выше, а из-за усталости точность распознавания падает в среднем на 7%. Влияет и температура руки: остывание меняет сигнал на 2,8 Гц на каждый градус Цельсия.
Путь к адаптивным алгоритмам
«Исследование показало: даже самые мощные нейросети бессильны перед индивидуальными различиями, — комментирует Кирилл Головань. — Мышечный почерк каждого человека настолько уникален, что его теоретически можно использовать как пароль. Поэтому ни одна из моделей не смогла с первого раза правильно его распознать. На первый план выходят адаптивные алгоритмы».
По мнению ученых, путь к универсальным ЭМГ-устройствам — в комбинации базовых моделей, уже обученных на больших данных, и алгоритмов мини-калибровки, которые за несколько секунд усваивают основные жесты пользователя и дообучаются в дальнейшем.
Сейчас наиболее зрелые ЭМГ-технологии сосредоточены в «умных» протезах и телеуправлении роботами. Главные коммерческие приложения — девайсы дополненной и виртуальной реальности, носимая электроника. В перспективе ЭМГ-приборы могут быть востребованы в медицине: для восстановления пациентов после инсульта, диагностики нейромышечных заболеваний или контроля эффективности упражнений у спортсменов. Особый интерес вызывают разработки устройств «безмолвной речи», которые регистрируют активность артикуляционных мышц лица и шеи и преобразуют ее в слова.
Комментарии
0 всего