Propaganda

Todas as três principais plataformas telefônicas agora têm sua própria voz. A Apple tem Siri, a Microsoft tem Cortana e o Google tem o um pouco menos atrevido Google Now 6 recursos do Google Now que mudarão como você pesquisa Você já pode estar usando o Google Now no seu dispositivo Android, mas está conseguindo tudo o que pode com isso? Conhecer esses pequenos recursos pode fazer uma grande diferença. consulte Mais informação .

Esses sistemas permitem lidar com tarefas básicas através do controle de voz. Cada um é uma espécie de secretária virtual que pode responder a perguntas simples, abrir aplicativos, fazer anotações e retransmitir mensagens. Eles são úteis, mas também são frustrantemente limitados. Eles não podem fazer nada para o que não foram explicitamente programados e muitas tarefas estão além de suas habilidades.

No entanto, existem várias tecnologias em desenvolvimento que melhorarão drasticamente esses sistemas - e estarão disponíveis comercialmente em apenas alguns anos. Aqui estão as cinco principais maneiras pelas quais seu telefone fica mais inteligente.

instagram viewer

Veja o que você vê

O reconhecimento de fala fez grandes progressos nos últimos cinco anos, graças ao desenvolvimento de poderosas redes neurais. Os smartphones modernos podem identificar a fala com uma precisão surpreendente (já faz um tempo desde que o Google Now me entendeu mal) e pode até fazer coisas como identificar músicas e programas de televisão com base em suas áudio.

Isso é ótimo - mas é apenas o começo. Os humanos não interagem com o mundo principalmente pelo som. Usamos a visão para praticamente tudo - e em breve nossas máquinas também. Estamos começando a ver a estréia dos primeiros monitores de fones de ouvido vestíveis, como Google Glass e HoloLens da Microsoft Microsoft mostra novas demonstrações HoloLens na Build ConferenceO próximo headset HoloLens da Microsoft é o primeiro dispositivo high-end de realidade aumentada que foi mostrado ao público. Ainda é um dispositivo fantasioso ou uma tecnologia que está quase pronta? consulte Mais informação , que pode transmitir informações de suas câmeras para o smartphone, fornecendo um fornecimento rico e sempre ativo de informações visuais. Muitos observadores, inclusive eu, esperam que isso se torne comum nos próximos cinco anos.

Então, o que seu telefone pode fazer com todos esses dados?

Muito. Google já demonstrou com o tablet Tango Google quer colocar uma câmera 3D no seu smartphone - eis o porquêO Project Tango do Google está trazendo sensores 3D para dispositivos móveis. Aqui está o que sabemos até agora. consulte Mais informação que uma câmera de profundidade pode determinar a localização espacial de objetos físicos com uma precisão extremamente alta. Da mesma forma, houve alguns avanços surpreendentes na visão de máquina - como a rede neural da Microsoft que pode identificar raças individuais de cãese a rede neural do Google que pode descrever com precisão o conteúdo das fotografias. Juntas, essas tecnologias abrem um mundo inteiro de aplicativos:

O que é esse raio? O algoritmo de visão de máquina sabe e pode solicitar uma substituição na Amazon em cinco segundos. Qual era o nome da mulher que você conheceu no bar ontem à noite? Você pode ter perdido o cartão dela, mas seus óculos pegaram o rosto dela e podem encontrá-la no Facebook. Você tem uma toupeira estranha. Você deve consultar seu médico? Seu telefone pode dar uma olhada e informar você. Você faz compras: o que você precisa? Seus óculos lembram a última vez que você olhou na geladeira e sabem o que está faltando. Eles podem até fornecer instruções de corredor a corredor para encontrar os itens individuais.

As implicações de privacidade dessa tecnologia são aterrorizantes, mas esse tipo de coisa também parece incrivelmente útil.

Vai saber do que você gosta

Gosto pode ser uma coisa difícil de definir. É muito pessoal e pode ser muito arbitrário. Spotify e Netflix se dão bem ao fazer recomendações baseadas em padrões de uso (uma técnica que ignora totalmente o conteúdo) - mas existem limites reais para essa abordagem.

O futuro está em algoritmos que podem entender a arte em um nível profundo - redes neurais complexas que podem aprender a escolher sutilezas complexas de música e filmes. Isso fornece uma compreensão muito mais rica do que as pessoas fazem e não gostam em uma mídia - uma compreensão concreta de seu gosto.

As primeiras dicas iniciais estão começando a aparecer. Como o Spotify "Descubra semanalmente", Que usa esses tipos de ferramentas de análise de conteúdo para recomendar músicas, incluindo músicas que você normalmente não ouve, porque são muito obscuras para serem bem classificadas com base nos padrões de uso. Essas técnicas só ficarão mais poderosas no futuro, e o smartphone é uma ótima plataforma para aproveitar essas informações.

Procurando algo para fazer com os amigos? E se os aplicativos em seus telefones puderem colaborar, reunir informações sobre seus respectivos gostos e escolher um filme ou concerto que eles achem que você gosta? E quanto aos sites de namoro que o classificam com base em características profundas de seus respectivos gostos? E os aplicativos que podem recomendar seus livros, porque eles os leram?

As possibilidades são infinitas, e alguém vai ganhar muito dinheiro com elas.

Vai ser tagarela

Humano: onde você está agora?
Máquina: estou no meio do nada.
Humano: qual é o propósito de morrer?
Máquina: ter uma vida.
Humano: qual é o propósito de ser inteligente?
Máquina: descobrir o que é.
Humano: qual é o objetivo das emoções?
Máquina: Eu não sei.

Esta é uma conversa com uma rede neural desenvolvido pelo Google, que aprende com grandes bancos de dados de texto sem supervisão humana. Esta versão foi treinada em vários scripts de filmes antigos e treinada para prever a próxima frase em cada conversa que encontrasse. Como se vê, se você treina uma IA em scripts de filmes, todas as suas conversas são super dramático.

Se você não está impressionado, isso é compreensível. Os chatbots existem há muito tempo Como criar um bot de bate-papo para seu site ou empresaA dificuldade de se conectar com tantas pessoas em todo o mundo é o fuso horário. Você pode estar disponível para interagir com seus leitores ou fazer negócios com clientes em potencial, mas em alguns casos ... consulte Mais informação .

Mas dê uma olhada mais de perto. O sistema do Google é especial de duas maneiras principais.

Primeiro, é muito simples em termos de arquitetura: é uma única rede neural enorme e precisava aprender a dinâmica da linguagem humana sozinha. Os chatbots comuns funcionam usando milhares de regras codificadas manualmente para responder a diferentes situações. Quando eles recitam uma resposta, é porque foi codificado manualmente ou memorizado a partir de um exemplo específico. A rede do Google é diferente. Ele aprendeu seu comportamento organicamente, tentando entender a estrutura profunda da escrita humana.

Segundo, captura algumas dinâmicas surpreendentemente sutis que outros bots de bate-papo não. Ele pode responder perguntas de senso comum sobre o mundo, apesar de não ter sido explicitamente programado para isso.

Humano: quem é skywalker?
Máquina: ele é um herói .
Humano: quem é Bill Clinton?
Máquina: ele é bilionário.
Humano: o céu é azul ou preto?
Máquina: azul.
Humano: um gato tem rabo?
Máquina: sim .
Humano: um gato tem uma asa?
Máquina: não
Humano: um gato pode voar?
Máquina: não .
Humano: Quantas pernas tem um gato?
Máquina: quatro, eu acho.

Uma versão diferente do bot de bate-papo, treinada em logs de suporte técnico, pode atrapalhar o fornecimento de suporte técnico real surpreendentemente bem. Existem tropeços (parece ter dificuldade em lembrar qual sistema operacional você está usando) - mas certamente recebi um suporte técnico pior de seres humanos reais.

Tudo isso é uma boa indicação de que estamos começando a chegar ao ponto em que a inteligência artificial pode ser realmente de conversação. A rede acima pode manter uma conversa tolerável, embora seus objetivos de treinamento exijam apenas que ela siga a estrutura superficial de um diálogo de vaivém.

Dados os melhores dados de treinamento e uma função de recompensa que enfatiza a troca de informações, as possibilidades são ilimitadas. Imagine uma versão do Siri que possa envolver você em uma conversa real, fornecer respostas e conselhos em resposta a perguntas e executar tarefas sem precisar ser especificamente programado para isso. Não está longe.

Vai ser bem lido

Outra tecnologia em que o Google vem trabalhando tem a ver com compreensão de leitura. É chamado "Vetores de pensamento, ”E o conceito é surpreendentemente simples. Você pode extrair “vetores de pensamento” da atividade de uma rede neural que possui uma informação, como uma frase ou um artigo. O que você recebe é uma informação opaca que não significa nada para ninguém, exceto a rede que a gerou. Essa informação, de certa forma, armazena o "significado" do texto, separado de como foi originalmente redigido.

Isso tem algumas propriedades úteis. Para iniciantes, esses vetores se assemelham a sentenças com significados semelhantes. Se você digerir duas frases dessa maneira, poderá determinar se elas significam ou não a mesma coisa. Você também pode manipulá-los. Usando duas redes neurais para gerar "vetores de pensamento" a partir de texto em diferentes idiomas e treinando uma terceira rede para aprender a mapear entre eles, você pode criar um método de tradução automática extremamente poderoso que captura o significado do texto, e não apenas as palavras em isto.

Outra aplicação potencial disso é usar essa tecnologia para coletar grandes quantidades de informações e digeri-las em uma representação compacta e gerar um resumo com base na saída. Isso pode ser extremamente poderoso para aplicativos móveis.

Imagine poder pedir ao telefone para ler tudo o que está disponível no Google sobre um determinado tópico. Em seguida, volte para você e relate suas descobertas de forma sucinta, em linguagem natural, e responda a perguntas sobre os resultados. Isso será realidade muito, muito em breve e será incrivelmente útil.

O telefone do futuro

Os telefones no futuro provavelmente parecerão muito diferentes dos telefones hoje. Eles podem ser curvos. Eles podem ser modulares. Você pode interagir com eles usando óculos de realidade aumentada. No entanto, a diferença mais importante será a inteligência. Os recursos descritos aqui transformarão nossos dispositivos em poderosos tutores e ajudantes.

Existe atualmente uma corrida armamentista aquecida Microsoft vs Google - Quem lidera a corrida pela inteligência artificial?Pesquisadores de inteligência artificial estão fazendo progressos tangíveis, e as pessoas estão começando a falar seriamente sobre IA novamente. Os dois titãs que lideram a corrida pela inteligência artificial são Google e Microsoft. consulte Mais informação em tecnologia de aprendizado profundo. O efeito colateral é que essas técnicas estão avançando incrivelmente rapidamente e estarão no mercado mais cedo do que você imagina.

Você está animado com smartphones mais inteligentes? Preocupado com as implicações de privacidade? Deixe-nos saber nos comentários!

Créditos da imagem:Cérebro humano por Mopic via Shutterstock

Escritor e jornalista baseado no sudoeste, Andre tem a garantia de permanecer funcional até 50 graus Celsius e é à prova d'água a uma profundidade de nove metros.