На связи со студией программы «Утро в Петербурге» Кирилл Кириленков, аналитик данных и инженер по машинному обучению.
Тимофей Зудин, ведущий: Не забывайте, пожалуйста, что подавленное состояние, нежелание возвращаться к привычным задачам, головные боли – всё это может быть симптомами такого серьёзного расстройства, как депрессия, и она часто маскируется под физическое недомогание.
Ксения Бобрикова, ведущая: Чтобы упростить её диагностику, исследователи и разработчики из Новосибирского государственного университета создали технологию, которая помогает определить уровень депрессии по голосу. Как она работает и в каких случаях может применяться, обсудим с экспертом.
Тимофей Зудин, ведущий: Как вообще пришла вам идея провести подобное исследование?
Кирилл Кириленков, аналитик данных и инженер по машинному обучению: Эта идея возникла у меня пару лет назад во время обучения в магистратуре Московского физико-технического института. Там мы с одногруппниками решали задачу на определение настроения говорящего с помощью анализа его голосовых сообщений. Требовалось разработать алгоритм, который бы определял в речи такие эмоционально-мотивационные состояния, как, например, сочувствие, интерес, недовольство, зависть. Мы достаточно успешно решили эту задачу с высокой точностью с помощью предобучения и дообучения моделей трансформеров. Тогда я задумался над возможностью разработки алгоритма для диагностики психопатологий по голосу, начал искать подходы к решению в публикациях и предложил коллегам из Новосибирского государственного университета собрать датасет и попробовать разработать такое приложение.
Ксения Бобрикова, ведущая: Сколько человек удалось протестировать, и какова точность вашего метода?
Кирилл Кириленков, аналитик данных и инженер по машинному обучению: На сегодняшний день нам удалось собрать датасет из 93-х аудиоинтервью испытуемых, у которых разная степень выраженности симптомов депрессии – от полного отсутствия симптомов до достаточно выраженных признаков. Но это только начало, мы планируем собрать гораздо больший объём данных. Что касается точности метода, мы обучили несколько моделей, и в среднем точность достигает примерно 0,9, то есть около 90%.
Тимофей Зудин, ведущий: На какие показатели система ориентируется – громкость голоса, интонация, слова, лексика?
Кирилл Кириленков, аналитик данных и инженер по машинному обучению: Здесь нельзя с достоверностью сказать, на какие конкретно характеристики речи ориентируется уже обученная модель. Нейросетевые модели машинного обучения вычленяют нелинейные, неочевидные для человека и слабо формализуемые паттерны. Вероятнее всего, это комплекс свойств, включающих, например, изменения спектральных и темпоральных характеристик речи у людей с депрессивным расстройством.
Ксения Бобрикова, ведущая: Какой вообще объём разговора необходимо проанализировать? Какая беседа подойдёт для этого?
Тимофей Зудин, ведущий: Есть ли какой-то опросник, на который люди должны отвечать? Что именно вы анализируете?
Кирилл Кириленков, аналитик данных и инженер по машинному обучению: В итоговом продукте опросник не потребуется. Когда мы собирали аудиоинтервью, испытуемые действительно заполняли опросники, и их баллы использовались в качестве меток для моделей машинного обучения. Сейчас мы изучаем, какой объём речи достаточен для надёжной оценки наличия признаков депрессии. Тем не менее минимальный фрагмент может составлять около 10-ти секунд.
Тимофей Зудин, ведущий: Где и как может применяться эта система? Это службы психологической поддержки, приём первичных звонков, неврологические или психологические диспансеры?
Кирилл Кириленков, аналитик данных и инженер по машинному обучению: Скорее, это продукт, который может использоваться как инструмент первичного скрининга на очном приёме у врача. Причём необязательно у психотерапевта, возможно применение и терапевтом.
Ксения Бобрикова, ведущая: Вы продолжаете работать над этой программой? Могут ли в будущем появиться подобные технологии, например, для определения лжи или других состояний?
Кирилл Кириленков, аналитик данных и инженер по машинному обучению: Это достаточно провокационный вопрос. Сегодня достижения машинного обучения таковы, что меня уже мало что удивляет. Теоретически подобные решения могут быть реализуемы.
Тимофей Зудин, ведущий: Может ли эта система быть доступна обычным пользователям? Иногда важно понять по разговору, нет ли у близкого человека депрессии.
Кирилл Кириленков, аналитик данных и инженер по машинному обучению: Здесь есть этические ограничения. Необходимо согласие самого человека на подобную диагностику. Сейчас мы ориентируемся в первую очередь на профессионалов – врачей. Если технология будет доведена до клинического применения, тогда можно будет рассматривать более широкий доступ, например, через приложение.
Ксения Бобрикова, ведущая: Напомним, что депрессия – это серьёзное заболевание, и ни в коем случае нельзя ставить себе диагноз самостоятельно. Ваша технология всё-таки даёт прогноз?
Кирилл Кириленков, аналитик данных и инженер по машинному обучению: Система определяет вероятность наличия депрессии и степень её выраженности. Она не заменяет врача и не заменяет диагностику. Врач будет использовать её вместе с традиционными методами, предусмотренными клиническими рекомендациями, и оценивать состояние пациента, в том числе с опорой на международные классификаторы заболеваний.