KevinSimback

vip
Idade 1.5 Ano
Nível máximo 0
Ainda sem conteúdo
O código aberto em IA está a ter um grande momento, e eu estou aqui para isso.
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Humor atual
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Usar um LLM como juiz é a forma mais simples e fácil de criar um ciclo
1. Faça o que já faz ao solicitar à IA
2. Use outro modelo para avaliar a saída e dar feedback
3. Itere até que ambos estejam satisfeitos
Veja apenas a saída final quando o ciclo estiver completo
Como estás a usar um LLM como juiz, isto é geralmente melhor para tarefas não determinísticas como investigação, design, especificações de construção, etc.
Usar o Looper para fazer isto tornará tudo muito mais fácil ao refinar o teu prompt para um ciclo melhor construído, adicionar o juiz e definir os critérios de saída para que nã
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Adoro os debates recentes sobre memória, mas eis o que muitos estão a perder:
Num espaço de ~6 meses passámos de conversas maioritariamente gerais para um uso intensivo de agentes que é 5-100x+ mais intensivo em memória
E não vai parar por aí
O lado da procura desta equação é insano
Ver original
post-image
  • Recompensa
  • 1
  • Republicar
  • Partilhar
SAHEN:
nova atualização ir para a lua 🌚

meu UID um bom dia hoje Ame as ideias para uma vida melhor é um redpack as ideias que eu
Induzido por PTSD, se sabes sabes
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
GLM 5.2 vs Opus 4.8 vs GPT 5.5
Na Delphi somos utilizadores avançados de IA e temos um chat de grupo muito ativo para discutir todos os modelos e tendências
Consenso geral:
> Todos os 3 têm os seus momentos bons e maus, nenhum vencedor definitivo
> O GLM é bastante bom, como muitos sugerem na timeline
> O Opus continua a ser o melhor em design e visualizações
> O GPT é o modelo de trabalho mais comum para tarefas do dia a dia + agentes
Ter todos os 3 através de planos de codificação subsidiados é a jogada de poder
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Acabando de sair de Itália no meio desta onda de calor, não percebo mesmo porque é que o ar condicionado é sequer um debate
Literalmente toda a gente — incluindo os locais — está a queixar-se
Estar a sufocar dentro de casa só deixa as pessoas irritadiças, instala o ar condicionado de uma vez
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Se você não é dos EUA ou da China, não sei como consegue ficar de fora e tornar-se dependente deles para a inteligência que irá definir o futuro
Pensar que seria uma prioridade nacional ter uma estratégia aqui
Claro, mais fácil dizer do que fazer - é preciso dinheiro grande e talento para competir com os laboratórios de fronteira
O passo mais fácil é construir centros de dados soberanos e hospedar os modelos de pesos abertos ou versões treinadas posteriormente - pelo menos você possui alguma forma de inteligência
Os Emirados Árabes Unidos e a Arábia Saudita parecem estar seguindo esse
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Se estiver a fazer diligência numa nova startup, agora precisa de avaliar a sua “natividade em IA” juntamente com a equipa, produto e mercado
Porquê? Se não estiverem na vanguarda do uso de IA, correm o risco de não executar rápido o suficiente
Não é um filtro de aprovação rígido, mas é um sinal - aqui estão alguns indícios iniciais:
1. Deram-lhe um ficheiro .md, juntamente com uma apresentação, que possa alimentar ao seu LLM?
2. Construíram uma apresentação interativa em HTML ou apenas enviaram um PDF/docsend?
3. Falam sobre competências proprietárias, dados, avaliações ou métodos q
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Se estiver a avaliar uma nova startup, agora precisa de avaliar a sua “natividade em IA” juntamente com a equipa, produto e mercado
Porquê? Se não estiverem na vanguarda do uso de IA, correm o risco de não executar rapidamente o suficiente
Não é um filtro de aprovação rígido, mas é um sinal - aqui estão alguns indícios iniciais:
1. Deram-lhe um ficheiro .md, juntamente com uma apresentação, que possa alimentar ao seu LLM?
2. Construíram uma apresentação interativa em HTML ou apenas enviaram um PDF/docsend?
3. Falam sobre competências proprietárias, dados, avaliações ou métodos que es
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Adivinha isto:
O que acontece quando o GLM-6 for lançado e tiver capacidades Fable/Mythos?
Não é uma questão de se, mas de quando
E compreender os cenários e implicações é incrivelmente importante
GLM-3,31%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Acabei de me inscrever num plano secundário Sakana Fugu - vamos ver quão rápido o consumo
É difícil não experimentar com esses resultados
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Um grande problema com as criptomoedas neste momento é que você tem que assumir que todos os novos projetos de tokens vão ser um golpe, intencionalmente ou não
Mas para que a IA descentralizada funcione, você precisa de alguns mecanismos de coordenação e os tokens fazem mais sentido
Como podemos conciliar isso?
TOKEN0,13%
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
B200 a 4,37 $/h - Eu seria um comprador aqui
A queda nos H100s faz sentido - eles simplesmente não são tão bons para modelos grandes ou cargas de trabalho agenticas com cache pesado
No entanto, o B200 é uma potência, é onde você gostaria de rodar o GLM-5.2 e os modelos de código aberto SOTA
Eu apostaria nessa demanda
Ver original
post-image
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A Meta está a começar a parecer o maior erro próprio da era da IA
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A Fable veio e foi - foi boa?
O GLM 5.2 acabou de ser lançado - é bom?
A maioria responderá de forma anedótica, mas todos devemos criar nossas próprias avaliações pessoais
Escolha alguns fluxos de trabalho estruturados que você faz com frequência, construa um conjunto de avaliação, e depois execute-os com qualquer novo modelo como uma primeira tarefa
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
O enigma da inferência do consumidor:
Vejo muitos projetos de inferência orientados ao consumidor trabalhando para enfrentar o alto custo das APIs de fronteira
Os métodos variam, mas a premissa é fornecer inferência mais barata em comparação com agregadores como o OpenRouter
O desafio aqui é uma questão de timing
Hoje, os consumidores recebem IA de fronteira altamente subsidiada
Muitas opções para os consumidores obterem planos de inferência SOTA a partir de 10 dólares e os planos de 200 dólares por mês oferecem uma quantidade insana de uso
Simplesmente não há tanta demanda de consumidores por
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
A prioridade número 1 para toda a indústria de IA neste momento deve ser o avanço dos modelos de código aberto baseados nos EUA
Não há razão para os EUA não terem paridade com, ou superarem, os modelos de código aberto provenientes da China
Ver original
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
  • Fixado