Início Ciência e tecnologia O novo modelo da DeepSeek obtém notas muito boas em pensamento

O novo modelo da DeepSeek obtém notas muito boas em pensamento

42
0

Há um novo modelo na cidade e ele está chamando a atenção dentro da indústria, embora a maioria dos americanos provavelmente nunca tenha ouvido falar dele.

DeepSeek é um grande modelo de linguagem desenvolvido por uma empresa chamada High Flyer Capital Management, que os especialistas descrevem como um fundo de hedge quantitativo. Esta organização criou uma série de modelos e versões do DeepSeek, alguns dos quais superam os modelos mais atuais em desenvolvimento na OpenAI e em outros lugares.

Em particular, há um novo modelo chamado DeepSeek R1-Lite-Preview, que está recebendo o maior faturamento de alguns analistas, como uma das ferramentas mais eficazes disponíveis no momento, no início de nossa era de raciocínio em cadeia de pensamento.

Este modelo DeepSeek exibe cadeia de pensamento e tem melhor desempenho em alguns tipos de inferência lógica, raciocínio matemático e tarefas de resolução de problemas em tempo real do que o OpenAI ou Anthropic podem fornecer.

Competição Nacional e Competição Internacional

Internamente, o DeepSeek está competindo com os modelos Qwen desenvolvidos pelo Alibaba. Relatei ontem como Qwen se sai muito bem com o conjunto de dados MATH que usa o currículo de matemática do ensino médio para testar modelos e comparar e contrastar suas habilidades.

DeepSeek-R1-Lite-Preview é especificamente creditado por superar outros modelos desse tipo com o conjunto de dados MATH e outras solicitações.

Internacionalmente, OpenAI e Anthropic e outras empresas estão tentando manter o domínio no campo. No entanto, temos pessoas como CEO da Hugging Face, Clement Delangue, admitindo que “(o modelo de Qwen) é o rei, e os modelos abertos chineses estão dominando em geral”.

E então você tem figuras como Liu Qingfeng, fundador do grupo chinês de IA iFlytek, que teria dito: “A diferença entre os EUA e a China não é tão grande quanto todos pensam. Em muitos setores verticais, nossos (modelos) são melhores do que deles.”

Há também o debate sobre modelos abertos que está ocupando muito tempo no cenário da mídia tecnológica. Os modelos fechados são mais seguros, mas os modelos abertos são mais igualitários.

O que o modelo do DeepSeek pode fazer

Se você gosta dos detalhes mais intuitivos de como os modelos superam uns aos outros, você pode estar se perguntando: o que o DeepSeek-R1-Lite-Preview faz de tão melhor que outros modelos?

Este artigo da Venture Beat fornece dois exemplos muito concretos do modelo que resolve a questão: “quantas letras R existem na palavra morango?” e, alternadamente em linguagem numérica, “qual é maior, 9,11 ou 9,9?”

Então esse é o tipo de resposta a perguntas que mostra habilidades de resolução de problemas e inferência lógica.

Especificamente, Venture Beat relata que o modelo excede o desempenho do nível OpenAI-o1-Preview em MATH.

Suas capacidades de raciocínio são aprimoradas por seu processo de pensamento transparente, permitindo que os usuários acompanhem enquanto o modelo enfrenta desafios complexos passo a passo.

Para ser justo, a visualização o1 do OpenAI também faz uma cadeia de pensamentos. Eu o usei e fiquei impressionado ao observar as tarefas que ele executa para responder a uma pergunta. Mas é importante compreender o contexto do mercado e quais modelos estão na vanguarda neste momento, à medida que os LLMs mais brilhantes chegam à frente da sala de aula.

Quanto às aplicações lógicas, estamos vendo todos e quaisquer desses novos modelos sendo integrados às ferramentas da indústria em um amplo espectro de campos. Mas isso é um pouco sobre o que os analistas estão dizendo agora, enquanto avaliam modelos que ainda estão em beta, ainda muito incipientes e ainda emergindo em nosso mundo.

Fonte