"Я уже почти три года не работаю в этой сфере, но по состоянию на три года назад реальная ситуация с 3д-распознаванием лиц была такой", - пишет глава предвыборного штаба Алексея Навального в Facebook в связи с презентацией смартфона iPhone X, который получил систему распознавания лиц Face ID.
1. "Неопределенность Гейзенберга". Ты можешь выбрать, чего не будет - ложных срабатываний или ложных отказов, - но не одновременно. Грубо говоря, можно сделать так, чтобы 3д-сканер всегда правильно распознавал тебя, но в 10% случаев он распознает как тебя и кого-то другого; можно сделать так, чтобы 3д-сканер никогда не принимал другого человека за тебя, но в 10% случаев он не распознает тебя, если ты смотришь немного в сторону, похудел, побрился или у тебя слегка припухли крылья носа из-за аллергии. (Или можешь настроить баланс посередине, получив 5% ложных срабатываний и 5% ложных отказов, пожалуйста!) Это типичная совершенно дилемма для любой задачи распознавания; вполне естественно, что такая трудная задача, как распознавание лиц, не исключение.
2. Это не смущало большие компании, которые активно инвестировали в распознавание лиц, потому что есть очень широкий круг задач, которые требуют распознавания, но в существенно упрощенном виде.
Пример: ты сидишь дома на диване перед большим телевизором и смотришь футбол; в перерыве идет реклама невероятно заманчивых сепулек, и ты понимаешь, что жить без сепулек не можешь. Ты можешь купить их с уникальной скидкой прямо сейчас - предлагает реклама, - и ты хочешь это сделать. Но производитель сепулек адски потеряет в конверсии, если в этот момент тебе понадобится вставать и идти за кошельком с кредиткой. Продажи будут куда лучше, если ты сможешь, не вставая с дивана, помахать рукой или утвердительно кивнуть головой, подтверждая покупку. При этом встроенному в телевизор 3д-датчику надо определить, что перед ним совершеннолетний член семьи, имеющий право покупать сепульки; для этого достаточно правильно распознать его лицо из пяти, уже имеющихся в базе, - и эта задача несравненно проще, чем распознавание "вообще". (И таких применений скоро будет очень много).
3. А вот распознавание вообще до последнего времени оставалось уделом совершенно отдельного технологического сектора, специализированных компаний, работающих в сфере безопасности. Качественные устройства стоят тысячи долларов и применяются в тех сферах, где можно подчинить всех сотрудников определенному пользовательскому поведению ради безопасности.
Пример: доступ в служебные зоны аэропорта - главное, чтобы не было ложно-положительных срабатываний, чтобы не пустить того, кого не нужно; а ложно-отрицательные не страшны - сотрудника можно заставить не двигаясь смотреть в камеру под определенным углом столько раз, сколько нужно, если это необходимо для обеспечения безопасности.
Так что эксперимент Apple с резким выводом этой специализированной технологии на широкий потребительский рынок очень интересен - и довольно сомнителен. Интересно, где и как они нащупали баланс из пункта 1 моего поста. Думаю - выставили его максимально "либерально", потому что негативный пользовательский опыт, когда ты не можешь залогиниться в свой же телефон, быстрее вызовет массовый потребительский скепсис в отношении технологии, чем редкие случаи, когда оказалось, что кто-то другой тоже распознается как ты.
Но это и означает, что для пользователей с чувствительными данными по-прежнему нет другого выбора, кроме длинного нецифрового пароля".