TECNOLOGIA

Depois da DeepSeek, OpenAI lança modelos de IA ‘abertos’ que imitam raciocínio humano

Bloomberg — A OpenAI anunciou o lançamento novos modelos de inteligência artificial abertos e disponíveis gratuitamente que podem imitar o processo humano de raciocínio, meses depois que a DeepSeek, da China, ganhou atenção global com seu próprio software aberto de IA.

Os dois modelos, chamados GPT-oss-120b e GPT-oss-20b, estarão disponíveis na plataforma de hospedagem de software de IA Hugging Face e podem produzir texto – mas não imagens ou vídeos – em resposta às solicitações do usuário, disse a OpenAI na terça-feira (5). Esses modelos também podem realizar tarefas complexas, como escrever códigos e procurar informações on-line em nome do usuário, disse a empresa.

Os modelos são sistemas de peso aberto, semelhantes ao Llama da Meta. O termo “peso” refere-se aos parâmetros em um modelo de IA.

A OpenAI divulgou os diversos valores numéricos que os modelos captaram e com os quais foram ajustados durante o processo de treinamento, permitindo que os desenvolvedores os personalizem melhor. No entanto, a OpenAI não revela os dados usados para treiná-los, e fica aquém da definição de um modelo de IA verdadeiramente de código aberto.

Apesar do nome, a maioria dos modelos da OpenAI são sistemas fechados – o tipo de software que é controlado pelo desenvolvedor, não pode ser modificado pelos usuários e inclui menos transparência sobre seus fundamentos técnicos.

Como muitos de seus rivais norte-americanos, a OpenAI protegeu seus dados de treinamento e se concentrou em cobrar mais por seus modelos mais poderosos para compensar o imenso custo de desenvolvimento.

A OpenAI não lança um modelo aberto desde 2019, quando lançou o GPT-2, um antecessor do software que originalmente alimentava o chatbot ChatGPT.

Pouco depois que a DeepSeek lançou seu sistema R1 aberto em janeiro, o CEO da OpenAI, Sam Altman, disse que a empresa estava discutindo a liberação de alguns pesos de modelo. Ele também reconheceu que a OpenAI precisava “descobrir uma estratégia diferente de código aberto”. Mais recentemente, o Plano de Ação de IA do Presidente Donald Trump incentivou o desenvolvimento de modelos abertos, citando seu potencial para “se tornarem padrões globais” em negócios e pesquisas acadêmicas.

No entanto, os críticos do software de código aberto há muito argumentam que ele é menos seguro. Em julho, Altman publicou na rede social X que a empresa havia planejado lançar um modelo de peso aberto em meados daquele mês, mas estava adiando “para executar testes de segurança adicionais e analisar áreas de alto risco”.

“Embora confiemos que a comunidade construirá grandes coisas com esse modelo, uma vez que os pesos são lançados, eles não podem ser retirados”, disse Altman na época. A OpenAI pretende que os novos modelos abertos sejam usados por indivíduos, empresas e governos que queiram ajustar e executar sistemas de IA em seus próprios hardwares e serviços. A Orange e a empresa de software Snowflake estão entre as empresas que estão testando os modelos, disse a OpenAI.

Os dois novos modelos são relativamente compactos e eficientes. A opção mais potente, 120b, pode ser executada em uma unidade de processamento gráfico de 80 gigabytes, informou a empresa. O modelo 20b, por sua vez, pode operar em um laptop com 16 gigabytes de memória, disse a OpenAI.

Durante uma reunião com jornalistas nesta semana, a OpenAI disse que espera receber feedback dos usuários, que poderá ser analisado para decidir que tipo de modelo aberto será lançado no futuro.




Fonte Link

Mostrar mais

Artigos relacionados

Botão Voltar ao topo