News #11 da Tribo
Essa semana foi quente no mundo de IA! Teve grandes anúncios de novidades da Open AI com o GPT-4o e do Google.
GPT-4o | A Open AI lançou seu novo modelo, o GPT-4o. A inteligência do GPT-4, mais rápido e melhor pra texto, audio e vídeo. O comentário geral foi “ Her” - em referencia ao filme que conta de um homem que se apaixona por uma IA que interage por voz como se fosse uma humana. E foi isso que a demo mostrou, uma assistente que permite uma conversa super humana (desde o tempo de resposta, a possibilidade de “naturalmente interromper”, as respostas, o sentimento na voz e ela até canta). VALE A PENA assistir a demo. O “o” do nome vem de omnimodal, ou seja, do modelo suportar esses outros modos como audio e visão. Visão?? Sim. Pela camera a IA descreve o que está vendo, ajuda a resolver problemas de matemática e tem um video específico mostrando a tecnologia ajudando uma pessoa cega a “ver” o mundo.
O lançamento pareceu uma grande revolução, mas foram DUAS. O segundo? Esse modelo vai estar disponível na versão gratuita para todos! Isso é incrível. O melhor modelo do mundo grátis. Além de funcionalidades que só estavam disponíveis no pago como os GPTs, upload de imagem, memória, analise de dados… O pago vai oferecer limite de capacidade 4x maior. E através da API o acesso ao novo modelo vai ser 2x mais rápido, 50% mais barato e o limite é 5x maior. Ahhh, e além do app pro telefone, agora tem um app pro computador também.
Pra quem curte dar um deep dive, na página oficial do GPT-4o vale a pena ver os exemplos de capacidades. Do cartaz de detetive, imagens 3d, continuidade de imagens e o poema. Muita coisa legal.
GOOGLE I/O | A principal pergunta que hoje paira sobre o Google é se ele vai conseguir acompanhar a evolução de IA generativa e proteger sua participação de mercado nas buscas - o que se um Perplexity roubar 10% já machuca. Essa semana eles fizeram o I/O, o evento para desenvolvedores do Google que acontece anualmente, e eu gostei do que vi. As novidades são primeiro apresentadas pros desenvolvedores, então muita coisa inda não está disponível pro público em geral, mas dá pra ver o que vem por ai. A magia do Google está na combinação de usar um bom LLM com o diferencial que eles tem - a base de usuários que vai buscar no Google com sua tecnologia e base de informações. Eles mostraram por exemplo buscas complexas como “procure estúdios de Ioga e Pilates perto de casa e liste-os com os preços”. E assim, com a capacidade da LLM, você resolve em apenas uma busca o que levaria muito mais buscas e tempo. E usa o Google com o Google Maps.
Além disso, usuários de gmail poderão “conversar” com seu inbox, como pedir pra resumir todos os emails recebidos da escola das crianças, e fazer uma lista de datas, atividades e tarefas. Ou mesmo ver os arquivos no seu Google docs sobre o que seu filho está estudando de física e ele estudar com a AI, que usa a voz (bastante ‘humana’) para ensinar a matéria, interagindo - dando exemplos como uma analogia de futebol. Ou colocar agentes pra funcionar pra, no caso de você querer devolver uma comprar, buscar o email da loja e fazer toda a operação para devolver o item. E que tal interagir com suas fotos te ajudando por exemplo ao responder ao comando de “qual a placa do meu carro?”, buscando entre as imagens o carro que aparece com mais frequência. Ou pedindo pra ver uma retrospectiva do seu filho aprendendo a nadar.
E foram mais novidades como janelas de contexto pro Gemini de 2M de tokens (vs 1M antes, o que já era a maior do mercado). Isso vai permitir mais casos de uso e, no caso de uso pessoal, mais conteúdo seu pra basear respostas. Isso entre novidades de hardware e Gemma 2, a nova versão do modelo Open Source que sai em Julho.
ETERNIDADE | Start up que treina bots com as ideias e voz de pacientes terminais pra que eles continuem “aqui” pros familiares…
Quem mais lembrou de Be Right Back do Blackmirror? Isso vale horas e horas de conversa sobre impactos e novas formas de lidar com legado e luto.
VOZ ISOLADA E AMPLIFICADA | Esse video mostra uma tecnologia que permite isolar barulhos do som “ao vivo” de um ambiente e amplificar a voz de quem você quer ouvir, ou traduzir em real time. Eu super quero esse (odeio lugar muito barulhento). Direto do TED do Jason Rugolo.
PRA POLÍCIA NÃO | Microsoft baniu departamentos de polícia nos Estados Unidos a usarem sua tecnologia de reconhecimento facial. Isso rolou uma semana depois da Axon, uma empresa de armamento, anunciar um produto que - a partir do GPT-4 da Open AI - resume audio de cameras de policiais. Sim, isso envolve muitas preocupações como alucinação e viés racial (já que negros tem maior chance de ser parados por policiais e confundidos entre eles).
CRIATIVIDADE ESMAGADA? | O que deu o que falar foi o filme do novo iPad da Apple. Pra quem não viu a propaganda esmagava um monte de instrumentos e coisas num pequeno iPad (o mais fino já lançado). Anúncio fraco, pouco criativo e ‘agressivo’ num contexto de IA ameaçando o trabalho artístico. A System 1 analisou o ad e o resultado foi ruim. Mas o que valeu a pena pra aparecer nessa news foi que eles também testaram ao contrário: ao invés de destruir tudo pra virar um iPad, um iPad se expandindo pra virar tudo aquilo. Em ambos os casos ele falha, mas ao contrário vai um pouquinho melhor.
SEGREDOS DA ALIMENTAÇÃO | Desde que tive câncer tô cada vez mais natureba. Falar em evitar a doença e melhorar meu sistema imunológico é certamente algo que me motiva, ainda mais se tiver base científica e for pedido do Dr Buzaid, meu querido onco. E sim, acredita-se hoje que boa alimentação e exercício físico faz diferença em sobreviventes de câncer de mama. Apesar desse tema ainda estar sendo muito estudado (e talvez no futuro a gente vá dar risada do quanto a gente pouco sabe hoje) achei esse documentário da Netflix “Os Segredos da Alimentação”, com a Giulia Enders, bem interessante e didático. Ele defende a idéia de que devemos cultivar o bioma do nosso intestino e pra isso, é importante comermos uma boa variedade de frutas, legumes e verduras. Em sua tese frutas, legumes e verduras demoram mais para serem digeridos, percorrendo uma parte grande do intestino - e alimentando seu microbioma. Já os alimentos superprocessados são rapidamente digeridos no início do sistema digestivo. E assim as bactérias do seu intestino, sem alimento, acabam comendo a proteção da parede do intestino e começam a entrar no corpo. Aí o corpo precisa se defender - gerando um nível crônico de inflamação. Isso deixa o sistema imunológico sempre ativo, e ao mesmo tempo ‘distraído’ de ameaças mais importantes.
Eu sou a Fernanda Belfort. Marketeira de carreira, mãe, esposa, sobrevivente de câncer e hoje head do time de soluções para marketing da Salesforce. Comecei um grupo e um podcast chamados Tribo de Marketing em 2019, e sigo nessa jornada de uma lifelong learner que acredita na generosidade e abundância. AMO aprender e compartilhar. Um pouco de tudo, mas sempre com muito marketing e tech, de forma palatável :D
-Ouça o podcast da Tribo de Marketing.
-Siga no Instagram e no LinkedIn
-Acesse o Notion da Tribo de Marketing (beta) pra muito conteúdo legal e a Biblioteca da Tribo (todos os reports, e-books etc que passaram por mim desde 2020)!
-E mais umas coisinhas como uma aula que dei sobre AI no YouTube.