A Apple publica vários modelos de IA de código aberto que podem ser executados em smartphones

Por Gustavo José

maio 05, 2024

Acostumada a agir com cautela, a Apple mais uma vez surpreendeu o público ao publicar vários grandes modelos de linguagem (LLMs) chamados "OpenELM" como código aberto. Esses modelos de inteligência artificial, que podem ser executados localmente (por exemplo, diretamente em um smartphone), foram publicados antes da tão aguardada conferência anual da empresa. Eles podem ser integrados aos seguintes sistemas operacionais Apple.

Ultimamente, a Apple parece estar fazendo grandes avanços no campo da IA generativa, após anos de silêncio. Em janeiro, por exemplo, a empresa apresentou o Ferret, uma IA capaz de analisar textos e imagens e depois gerar informações relevantes com base nos dados obtidos.

Esta semana, a empresa de Cupertino revelou o OpenELM (Open source Efficient Language Models), uma série de “pequenos” modelos generativos de IA projetados para serem integrados diretamente em dispositivos. No entanto, mais detalhes sobre o projeto serão revelados na próxima Apple Worldwide Developers Conference (WWDC), que acontecerá de 10 a 14 de junho. Lá também serão apresentadas atualizações para os sistemas operacionais iOS e macOS. De acordo com alguns relatórios, o OpenELM provavelmente será lançado oficialmente junto com o iOS 18 e o macOS 15.

Pequenos LLMs de código aberto

O OpenELM, projeto da Apple, já está disponível em diversas versões na plataforma Hugging Face, espaço colaborativo especializado em inteligência artificial e que reúne desenvolvedores de todo o mundo. A empresa também publicou trechos de código na plataforma GitHub para que os desenvolvedores possam usar esses modelos em seus próprios projetos.

A decisão da Apple de tornar este projeto open source foi uma surpresa para alguns, embora outros gigantes da tecnologia como a Meta (reconhecida como uma organização extremista na Federação Russa e suas atividades são proibidas no país) também estejam apostando no open source. No entanto, esta não é a primeira vez que a Apple publica o código-fonte. Além disso, os detalhes técnicos destes novos modelos foram divulgados no servidor de pré-publicação arXiv.

OpenELM vem em diversas configurações, cada uma com um número diferente de parâmetros: 270 milhões, 450 milhões, 1,1 bilhão e 3 bilhões. Esses modelos são relativamente modestos em comparação com outros modelos de grande escala. Em comparação, o modelo LLama 3 da Meta tem 70 bilhões de parâmetros (uma versão ainda maior com 400 bilhões de parâmetros está em desenvolvimento).

No entanto, o tamanho reduzido dos modelos OpenELM não significa necessariamente que sejam menos eficientes. Na verdade, essas tecnologias utilizam uma técnica de dimensionamento camada por camada, o que melhora a precisão dos resultados.

A implantação local é a principal vantagem

Segundo rumores anteriores, a IA será implantada localmente, diretamente nos dispositivos da empresa, o que vai ao encontro da estratégia da Apple de tornar seus dispositivos mais autônomos quando se trata de IA. Esta abordagem também pode levar a reduções significativas no consumo de energia (a nível global e não local), uma vez que o processamento de dados ocorrerá em dispositivos e não em servidores remotos. Isso também terá um impacto direto na privacidade.

Os usuários podem esperar que os modelos OpenELM sejam integrados com vários recursos, permitindo-lhes se beneficiar diretamente dos avanços da Apple em inteligência artificial. Porém, ainda não foram divulgados detalhes de como esses sistemas serão implementados nos produtos Apple.

Imagem principal: new-science.ru

Gustavo José Escrever para a web é minha paixão.

Atrás da Porta

A Apple publica vários modelos de IA de código aberto que podem ser executados em smartphones

Pequenos LLMs de código aberto

A implantação local é a principal vantagem

Postar um comentário em "A Apple publica vários modelos de IA de código aberto que podem ser executados em smartphones "

Postar um comentário