Por que o telefone reconhece você usando uma máscara? Principalmente por causa disso

novembro 17, 2020 gurinho

Com o advento da epidemia, a função de desbloqueio facial degradou a nobre cabeça.

Quando as máscaras se tornam um item obrigatório para sairmos às ruas, sempre temos que passar pelo complicado processo de "falha de reconhecimento facial" – "inserir senha" ao desbloquear o telefone. Isso faz com que as pessoas percam o reconhecimento da impressão digital.

Para otimizar a experiência de desbloqueio facial, no início deste ano, a empresária estrangeira Danielle Baskin lançou uma máscara com informações faciais. O produto extrai as informações faciais do usuário e as imprime na parte externa da máscara. Depois que o usuário usa a máscara, ele pode reconstituir um rosto completo.

▲ Na verdade, um pouco assustador. Foto de: djbaskin

No entanto, a taxa de sucesso de desbloqueio deste produto ainda não está clara e não há um grande número de verificações de amostra. Então, como o sistema de reconhecimento de rosto das pessoas pode parar de ser incomodado por máscaras?

Alguns internautas descobriram gradualmente que, conforme o tempo de uso da máscara se torna cada vez mais longo, o telefone celular parece ter encontrado "experiência" em repetidas falhas de desbloqueio facial e é gradualmente capaz de reconhecer a si mesmo usando a máscara com sucesso.

Baseando-se nessa ideia, alguns blogueiros de tecnologia também compartilharam tutoriais mais eficientes, como desbloquear repetidamente enquanto usava uma máscara. Se o reconhecimento facial falhar, digite a senha imediatamente . Repita essa ação por cerca de 30 minutos, e o telefone pode reconhecer a pessoa que está usando a máscara. Sozinho.

▲ Desbloqueou o rosto com sucesso usando uma máscara. Foto de: Farhad Usmanoff

No entanto, no decorrer da prática, os internautas disseram que a velocidade de "aprendizado" de diferentes modelos é diferente. Algumas pessoas repetiram as ações acima por 20 minutos e tiveram sucesso, mas algumas pessoas as repetiram milhares de vezes e seus telefones celulares ainda não conseguem se reconhecer usando uma máscara.

Por que isso acontece? Na verdade, a resposta está relacionada à capacidade de aprendizado de IA dos telefones celulares.

▲ Imagem de: thenextweb

Arma de aprendizagem profunda – NPU

Se você acompanhou as conferências de telefones celulares nos últimos dois anos, deve ter descoberto que, quando os fabricantes de telefones celulares lançam chips SoC, eles se concentram em atualizações de NPU .

O assim chamado NPU refere-se ao processador da rede neural. Em um chip de celular, é geralmente dividido em várias áreas funcionais. Três são frequentemente mencionadas na entrevista coletiva: uma é a CPU, que é boa para lidar com tarefas complicadas e emitir comandos, a outra é a GPU, que é boa para processamento gráfico, e a outra é que é boa para lidar com trabalho manual. NPU para tarefas inteligentes.

Embora o NPU "ocupe" menos espaço do que o CPU e o GPU, seus recursos não podem ser ignorados.A inteligência de um telefone celular depende principalmente dele.

▲ Os chips com NPU são freqüentemente chamados de "chips AI" ou "chips biônicos". Imagem de: Lei Xue.com

O treinamento acima mencionado de telefones celulares para se reconhecerem usando máscaras se deve principalmente à capacidade do NPU. Depois que a câmera captura a imagem do rosto, a CPU e a GPU pré-processam a imagem em um tempo muito curto, então a NPU e a GPU detectam e extraem os recursos e, finalmente, a CPU, a GPU e a NPU completam em conjunto o reconhecimento e classificação do rosto.

Graças ao poder de computação cada vez mais poderoso, todo o processo foi capaz de atingir "insensibilidade". No momento em que pegamos o telefone, o processo acima foi concluído.

A adição do NPU permite que os telefones celulares reconheçam você em diferentes estados. Quando você acorda de manhã, mesmo que seu rosto esteja inchado, seu telefone sabe que é você. Mesmo depois de ser picado por uma vespa, sua boca estava inchada como uma "salsicha" e o telefone ainda conseguia reconhecê-la.

▲ Foto de: Captain Han Drifting

Assim, após um certo treinamento, o celular pode reconhecê-lo sem medo de máscaras.

Na verdade, se você depender apenas de algoritmos, a CPU e a GPU também podem cooperar para completar o aprendizado. Mas a desvantagem é a baixa eficiência e o alto consumo de energia. De acordo com a introdução de "Automotive Electronics and Software", a CPU e a GPU precisam usar milhares de instruções para concluir o processamento de neurônios, e a NPU precisa de apenas uma ou algumas para ser concluída.

▲ A eficiência de aprendizagem do NPU é bastante alta. Foto de: androidauthority

Além disso, com o mesmo consumo de energia, o desempenho do NPU é 18 vezes maior do que o do GPU. Pode ser visto que NPU tem vantagens óbvias na eficiência de processamento de aprendizado profundo.

Por falar nisso, devo mencionar o princípio de funcionamento do NPU. A razão pela qual NPU tem alta eficiência de aprendizagem não é porque bebeu as "seis nozes", mas porque simula neurônios humanos e sinapses na camada de circuito. E use o conjunto de instruções de aprendizado profundo para processar diretamente neurônios e sinapses em grande escala. Ao destacar o peso para alcançar a integração de armazenamento e cálculo, uma instrução do NPU pode ser competente para milhares de instruções da CPU e GPU anteriores.

▲ Foto de: forbes

Para usar uma analogia menos apropriada, isso é como a integração de armazenamento e logística realizada pela JD Logistics, que melhora muito a eficiência da entrega, e pode ser adquirida no mesmo dia ou até entregue no mesmo dia.

NPU não é insípido

A primeira empresa nacional a estudar NPU foi a Cambriana. O chip Kirin 970 lançado em 2017 usava a arquitetura NPU Cambrian. Kirin 970 também se tornou o primeiro chip AI móvel do mundo.

De acordo com a Huawei, o Kirin 970 com unidade NPU integrada tem cerca de 50 vezes a eficiência energética e 25 vezes as vantagens de desempenho ao lidar com as mesmas tarefas de aplicação de IA em comparação com os quatro núcleos Cortex-A73. Por exemplo, a velocidade de reconhecimento de imagem pode chegar a cerca de 2.000 folhas por minuto, o que é muito maior do que o nível da indústria no mesmo período.

▲ Kirin 970. Foto de: Álbum de Engenharia Eletrônica

Onze dias depois, o iPhone 8/8 Plus e o iPhone X lançaram o chip biônico A11. A Apple disse em entrevista coletiva que este é o chip mais poderoso e inteligente de sua história.

A11 Bionic é o primeiro processador da Apple denominado "Bionic", e também é o primeiro processador da Apple a suportar aceleração de IA. Por exemplo, na função de reconhecimento de face, seu mecanismo de rede neural permite que A11 suporte uma velocidade de até 600 bilhões de operações por segundo.

▲ Imagem de: stealthsettings

Também a partir deste ano, mais e mais fabricantes começaram a prestar atenção à promoção de recursos de IA de telefones celulares. Por exemplo, a fotografia IA principal da Huawei, cenas noturnas, gestos aéreos e outras funções; o ID de rosto orgulhoso do iPhone, desfoque de retrato, fusão profunda (fusão profunda) e outras funções, todos dependem intimamente dos recursos do NPU.

▲ Controle de gestos Huawei AI

Desde junho de 2019, com o lançamento do Kirin 810, a Huawei começou a usar chips de IA para celulares baseados em Da Vinci. A inteligência da arquitetura de Da Vinci é que cada unidade tem uma divisão de trabalho clara, o que permite cálculos de IA mais eficientes.

De acordo com a introdução do "Electronic Product World", o núcleo da arquitetura Da Vinci 3D Cube, unidade de computação vetorial vetorial, unidade de computação escalar escalar, etc., são cada um responsável por diferentes tarefas de computação para obter modelos de computação paralelos e, em conjunto, garantir o processamento eficiente da computação AI. Perceba as características de alto poder de computação, alta eficiência energética, flexibilidade e adaptabilidade.

Na recente conferência de imprensa da série Mate 40, a Huawei enfatizou que o NPU do chip Kirin 9000 foi atualizado para a versão 2.0 da arquitetura Vinci, dobrando o poder de computação. Embora o poder de computação AI seja mais forte, a eficiência energética aumentou 15% e o desempenho da rede também aumentou 20%.

Na lista AI Benchmark lançada pela ETH Zurich, Kirin 9000 ganhou o prêmio principal do campo Android, com uma pontuação mais do que o dobro da Qualcomm Snapdragon 865+.

▲ Lista de benchmarks de IA

Lembra da capacidade do Kirin 970 de reconhecer 2.000 imagens por minuto? Kirin 9000 evoluiu para uma velocidade de 2.000 quadros por segundo. Além disso, os gestos aéreos AI, tela inteligente AI desligada e legendas AI que foram destacadas na conferência de imprensa são todas manifestações de suas capacidades NPU.

O que mais me impressionou foi a função "Pagamento Inteligente" .Quando o celular detecta que está perto da caixa do scanner, ele automaticamente abre a página de código de pagamento e completa o pagamento de uma vez. Isso representa a direção de um terminal inteligente ideal: para "conhecê-lo", "conhecê-lo" e "ajudá-lo".

▲ Huawei Smart Pay. Foto de: VDGER

Quando o iPad Air de quarta geração foi lançado, a Apple também enfatizou o aprimoramento de suas capacidades NPU. Comparado com o processador biônico A12, o mecanismo de rede neural biônica A14 de nova geração torna o desempenho do aprendizado de máquina duas vezes mais rápido.

A velocidade de aprendizado de máquina ultra-alta permite que o chip biônico A14 realize a função de super pixel. Quando usado com o pixelmator, os pixels serão adicionados automaticamente às fotos cortadas para torná-las mais claras.

Refletida na série do iPhone 12, os recursos de fotografia computacional também foram aprimorados sem precedentes. Para um pequeno exemplo, durante a fotografia em lapso de tempo, o telefone móvel calculará automaticamente o assunto. Se estiver capturando tráfego, o telefone móvel reduzirá automaticamente a velocidade do obturador para fazer as luzes parecerem borradas e a imagem ficar mais fluida.

Comparado com o iPhone 11, a nova geração do iPhone tem mudanças visíveis no Deep Fusion, vídeo HDR e assim por diante. Tudo isso graças ao poderoso poder de computação AI do A14.

O que podemos esperar do NPU?

Embora o NPU móvel só tenha sido anunciado pelos fabricantes nos últimos dois a três anos, na verdade, o conceito relacionado a ele apareceu em 2013.

Naquela época, a Qualcomm esperava estreitar a lacuna entre as operações normais da máquina e o cérebro humano por meio de uma estrutura de computação que imita o cérebro humano. Esse tipo de processador de computação que simula neurônios é chamado de "Zeroth" pela Qualcomm.

▲ Introdução da Qualcomm ao Zeroth

Chip Zeroth da Qualcomm, a estrutura computacional imita o modo de operação das células nervosas biológicas humanas e é imitada no nível estrutural do cérebro. NPU é imitado no nível da função cerebral e as direções dos dois não são consistentes. E a Qualcomm sempre insistiu em sua própria direção, não se juntando ao exército de NPU independente, mas insistindo na direção do motor de inteligência artificial AI Engine.

De acordo com os relatórios de "Xinzhixun", quando o Qualcomm Snapdragon 845 foi lançado, algumas vozes externas criticaram a Qualcomm por não seguir a tendência NPU, de modo que ficou para trás em recursos de IA. Alex Katouzian, vice-presidente sênior e gerente geral de negócios móveis da Qualcomm, respondeu que, embora a Qualcomm não tenha uma unidade de mecanismo de rede neural independente, ela usa uma arquitetura de aprendizado de máquina mais flexível (AI Engine) e otimiza o kernel em uma plataforma comum. Cada unidade, como CPU, GPU, DSP, etc., pode fornecer chamadas flexíveis de várias unidades de processamento para diferentes terminais móveis.

Você pode entender isso da seguinte forma: a direção do NPU é uma divisão clara de trabalho e o grau de intensidade de cada unidade é relativamente alto; enquanto a direção da Qualcomm AI Engine é "trabalhar em conjunto com todos".

Até o lançamento do chip Snapdragon 865 com o motor de inteligência artificial multi-core de quinta geração AI Engine, a Qualcomm ainda não tinha como entrar no NPU.

▲ A Qualcomm enfatizou os recursos de IA na parte inferior esquerda da imagem

No entanto, em uso real, a capacidade de aprendizado do Qualcomm Snapdragon 865 ainda é digna de reconhecimento. Por exemplo, quando usei o vivo X50 Pro + equipado com Qualcomm Snapdragon 865+ por quase meio mês, ele desbloqueou cerca de dez vezes por dia e agora pode me identificar usando uma máscara com sucesso.

No entanto, do ponto de vista dos dados, sua capacidade de aprendizado de IA ficou muito atrás da biônica Kirin 9000 e A14. NPU usou dados para provar sua força de IA repetidas vezes. Se o AI Engine de próxima geração da Qualcomm pode virar a maré, ainda precisamos esperar que a série 875 de chips esteja disponível para saber.

Na era da inteligência artificial, o que espero ver é que os telefones celulares não são mais terminais que respondem passivamente às necessidades do usuário, mas terminais inteligentes que podem analisar ativamente e perceber as necessidades atuais dos usuários e fornecer serviços relacionados com antecedência.

▲ Demonstração da capacidade AI da série Mate40

Nesse sentido, todos os fabricantes ainda estão engatinhando. Por exemplo, em termos de sugestões de aplicativos, acho que o melhor é Xiaomi. Por meio da análise de fatores como tempo e cena, ele pode "adivinhar" o software que desejo abrir todas as vezes e classificá-lo de maneira inteligente na posição mais visível. O "Smart Payment" suportado pela série Mate40 está sem dúvida na vanguarda da IA e também nos dá mais espaço para a imaginação.

Vale ressaltar que, além dos telefones celulares, o NPU também está gradativamente sendo aplicado a terminais móveis, como tablets e laptops. O recém-lançado chip M1 da Apple tem um NPU de 16 núcleos, que pode realizar 11 trilhões de operações por segundo, aumentando a velocidade do aprendizado de máquina para 11 vezes, o que é difícil de igualar e comparar com PCs tradicionais.

E quais mudanças na experiência do usuário serão trazidas pela série MacBook e Mac mini equipado com o chip M1, acredito que seja esperado.

No ecossistema de software atual, a melhoria da CPU e GPU móvel não é forte o suficiente para o uso diário dos usuários. Por exemplo, em comparação com um iPhone XS e um iPhone 12, a fluência do aplicativo é quase a mesma. O que mais afeta a experiência do usuário é a mudança nos recursos de aprendizado de máquina. É por isso que devemos prestar atenção ao desenvolvimento de NPU.

Talvez daqui a dez anos, quando o desenvolvimento da tecnologia de IA se tornar mais maduro, seja o momento de os telefones "inteligentes" serem renomeados como telefones "inteligentes".

Novo idioma (novo idioma)

Conte histórias simples e fáceis de ler. Email de trabalho: [email protected].

Email Sina Weibo

#Bem-vindo a seguir a conta oficial do WeChat da Aifaner: Aifaner (WeChat ID: ifanr), mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo