Ao revisar o Samsung Galaxy S22 +, alternei o Bixby Voice para testar seu tempo de resposta e deixei a configuração sempre ouvindo por pura preguiça. A cada poucos dias, a campainha de ativação do Bixby aparece do nada, me pedindo para repetir ou respondendo a perguntas que não fiz.
Por quê? Porque recentemente adotei um gato chamado Blue que meu parceiro e eu gostamos de chamar de “Silly Baby” em uma voz cantada (não julgue, todo mundo fala com seus animais de estimação). E, aparentemente, isso soa como “Hi Bixby” para os algoritmos da Samsung.
Bixby não é o único assistente excessivamente falador em nosso lugar. Nosso Echo Show 8 funciona principalmente como pretendido, mas o Alexa interrompe aleatoriamente “Desculpe, não entendi” ou “Aqui está algo que encontrei na web” no meio de conversas regulares. Não temos certeza de qual palavra ou frase causa isso, então nos acostumamos a gritar “Alexa, isso não era para você” para a infeliz IA.
E o Google Assistant permite reduzir a sensibilidade do microfone, em resposta às reclamações de seus próprios consumidores sobre falsos positivos.
A solução da Amazon foi alterar a palavra de ativação do Alexa para três outras opções: computador, Amazon ou Echo. Mas escolher os dois primeiros significaria censurar essas palavras de discussões regulares, e o Echo soa semelhante o suficiente para “ir” que parece ainda mais propenso a desencadear falsos positivos de frases cotidianas. Então, ficamos com a opção padrão.
Seja qual for o smartphone, alto-falante inteligente ou tela inteligente que você possui, você lidará com alguns falsos positivos. Permitir que as empresas armazenem seu perfil de voz ajuda um pouco na precisão das palavras. Mas fale o suficiente, e uma sequência aleatória de sílabas inevitavelmente soará como uma palavra quente.
Por que esse problema não foi embora? Para começar, porque as empresas querem que você repita a marca da empresa várias vezes. Diga “Hey Siri” ou “Hey Google” várias vezes e você começará a associar perguntas respondidas ou controles domésticos inteligentes a essa marca. Portanto, mesmo que uma palavra ou frase diferente como “xilofone” fosse menos provável de aparecer na linguagem cotidiana, não teria o poder de marketing que eles desejam.
As marcas também querem que você pense em seu assistente como uma pessoa, e é por isso que se esforçam tanto para preparar respostas encantadoras que simulem uma personalidade. Há uma razão pela qual 3 em cada 4 leitores do Android Central agradecem a seus assistentes quando concluem tarefas. Se você vê o Alexa como uma ferramenta artificial útil pessoa com um nomeé menos provável que você alterne os ecossistemas domésticos inteligentes.
Também é provável que haja alguma dificuldade de engenharia em fazer com que o assistente responda adequadamente a frases diferentes, levando a mais consultas perdidas ou tempo de resposta mais lento. O Google até brincou sobre isso durante sua Transmissão ao vivo do I/O 2018quando Kevin Durant continuou dizendo “Ei, Google”, e alguém brincou que “tenho certeza que os engenheiros amar para atualizar tudo” e mude para isso.
Mas mesmo reconhecendo tudo isso, eu diria que o Google pelo menos poderia facilmente fazer uma seleção melhor de palavras de ativação. O Assistente agora permite ativar comandos com frases rápidas ou “parar” o Google Assistente sem uma palavra de ativação. Além disso, na E/S mais recente, o Google apresentou sua nova tecnologia LaMDA, na qual o Assistente pode ter diálogos completos de várias consultas para responder a todas as suas perguntas – embora ainda esteja longe.
O Google é o rei das opções de personalização. Poderia facilmente permitir que você substitua palavras diferentes depois de “Ei” que não são tão fáceis de dizer acidentalmente ou serem pegas de um comercial.
Isso também garantiria que pessoas com vários alto-falantes inteligentes e telefones próximos possam ter palavras de ativação específicas para diferentes dispositivos, para que não sejam ativados de uma só vez a partir de uma única frase.
O Assistente é inteligente o suficiente para oferecer suporte a outra frase, que não acionará seu Nest toda vez que você ouvir “Ei Google” em um comercial de TV. E isso faria Siri e Bixby parecerem rígidos e atrasados em comparação, já que acho menos provável que a Apple ou a Samsung se ramificassem da mesma maneira. É o Google Assistant e o Alexa que lideram o pacote de assistentes inteligentes e têm o cérebro da IA para fazer isso.
Sobre o tema da Amazon, já está comprovado que pode fornecer alternativas ao Alexa. Eu preferiria apenas que suas opções de palavra de ativação se expandissem – para algumas opções mais fixas, pelo menos, ou (melhor cenário) nossas próprias frases personalizadas.
As casas inteligentes em 2022 não oferecem muito em termos de emoção. O padrão universal Matter deve chegar antes do final de 2022, mas foi adiado várias vezes, deixando os dispositivos domésticos inteligentes fraturados em diferentes ecossistemas. A maioria das pessoas usa apenas o Alexa Skills ou o Google Actions mais simples. O Google está matando o Snapshot (acima) para o Assistente.
A única notícia empolgante que vimos é o próximo Nest Hub executando o Android 13, mas isso é mais sobre a tela sensível ao toque do que o assistente de voz por trás dele. Acho que precisamos de algo mais para esperar.
Só posso esperar que futuros alto-falantes inteligentes e telefones Android ativem palavras de ativação novas e aprimoradas. Caso contrário, não importa o quão inteligente seja a IA, Alexa, Bixby e Google Assistant continuarão entrando em conversas indesejadas como o Kool-Aid Man.