Usar um LLM como juiz é a forma mais simples e fácil de criar um ciclo
1. Faça o que já faz ao solicitar à IA
2. Use outro modelo para avaliar a saída e dar feedback
3. Itere até que ambos estejam satisfeitos
Veja apenas a saída final quando o ciclo estiver completo
Como estás a usar um LLM como juiz, isto é geralmente melhor para tarefas não determinísticas como investigação, design, especificações de construção, etc.
Usar o Looper para fazer isto tornará tudo muito mais fácil ao refinar o teu prompt para um ciclo melhor construído, adicionar o juiz e definir os critérios de saída para que nã

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-28 14:34

Adoro os debates recentes sobre memória, mas eis o que muitos estão a perder:
Num espaço de ~6 meses passámos de conversas maioritariamente gerais para um uso intensivo de agentes que é 5-100x+ mais intensivo em memória
E não vai parar por aí
O lado da procura desta equação é insano

Ver original

1 gostos

Recompensa
1
1
Republicar
Partilhar

SAHEN:

nova atualização ir para a lua 🌚

meu UID um bom dia hoje Ame as ideias para uma vida melhor é um redpack as ideias que eu

KevinSimback

06-26 17:27

Induzido por PTSD, se sabes sabes

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-26 15:21

GLM 5.2 vs Opus 4.8 vs GPT 5.5
Na Delphi somos utilizadores avançados de IA e temos um chat de grupo muito ativo para discutir todos os modelos e tendências
Consenso geral:
> Todos os 3 têm os seus momentos bons e maus, nenhum vencedor definitivo
> O GLM é bastante bom, como muitos sugerem na timeline
> O Opus continua a ser o melhor em design e visualizações
> O GPT é o modelo de trabalho mais comum para tarefas do dia a dia + agentes
Ter todos os 3 através de planos de codificação subsidiados é a jogada de poder

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-25 12:25

Acabando de sair de Itália no meio desta onda de calor, não percebo mesmo porque é que o ar condicionado é sequer um debate
Literalmente toda a gente — incluindo os locais — está a queixar-se
Estar a sufocar dentro de casa só deixa as pessoas irritadiças, instala o ar condicionado de uma vez

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-24 13:11

Se você não é dos EUA ou da China, não sei como consegue ficar de fora e tornar-se dependente deles para a inteligência que irá definir o futuro
Pensar que seria uma prioridade nacional ter uma estratégia aqui
Claro, mais fácil dizer do que fazer - é preciso dinheiro grande e talento para competir com os laboratórios de fronteira
O passo mais fácil é construir centros de dados soberanos e hospedar os modelos de pesos abertos ou versões treinadas posteriormente - pelo menos você possui alguma forma de inteligência
Os Emirados Árabes Unidos e a Arábia Saudita parecem estar seguindo esse

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-24 11:13

Se estiver a fazer diligência numa nova startup, agora precisa de avaliar a sua “natividade em IA” juntamente com a equipa, produto e mercado
Porquê? Se não estiverem na vanguarda do uso de IA, correm o risco de não executar rápido o suficiente
Não é um filtro de aprovação rígido, mas é um sinal - aqui estão alguns indícios iniciais:
1. Deram-lhe um ficheiro .md, juntamente com uma apresentação, que possa alimentar ao seu LLM?
2. Construíram uma apresentação interativa em HTML ou apenas enviaram um PDF/docsend?
3. Falam sobre competências proprietárias, dados, avaliações ou métodos q

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-24 10:56

Se estiver a avaliar uma nova startup, agora precisa de avaliar a sua “natividade em IA” juntamente com a equipa, produto e mercado
Porquê? Se não estiverem na vanguarda do uso de IA, correm o risco de não executar rapidamente o suficiente
Não é um filtro de aprovação rígido, mas é um sinal - aqui estão alguns indícios iniciais:
1. Deram-lhe um ficheiro .md, juntamente com uma apresentação, que possa alimentar ao seu LLM?
2. Construíram uma apresentação interativa em HTML ou apenas enviaram um PDF/docsend?
3. Falam sobre competências proprietárias, dados, avaliações ou métodos que es

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-22 11:32

Adivinha isto:
O que acontece quando o GLM-6 for lançado e tiver capacidades Fable/Mythos?
Não é uma questão de se, mas de quando
E compreender os cenários e implicações é incrivelmente importante

GLM-3,31%

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-22 06:10

Acabei de me inscrever num plano secundário Sakana Fugu - vamos ver quão rápido o consumo
É difícil não experimentar com esses resultados

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-19 12:25

Um grande problema com as criptomoedas neste momento é que você tem que assumir que todos os novos projetos de tokens vão ser um golpe, intencionalmente ou não
Mas para que a IA descentralizada funcione, você precisa de alguns mecanismos de coordenação e os tokens fazem mais sentido
Como podemos conciliar isso?

TOKEN0,13%

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-18 09:18

B200 a 4,37 $/h - Eu seria um comprador aqui
A queda nos H100s faz sentido - eles simplesmente não são tão bons para modelos grandes ou cargas de trabalho agenticas com cache pesado
No entanto, o B200 é uma potência, é onde você gostaria de rodar o GLM-5.2 e os modelos de código aberto SOTA
Eu apostaria nessa demanda

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-17 16:17

A Meta está a começar a parecer o maior erro próprio da era da IA

Ver original

1 gostos

Recompensa
1
Comentar
Republicar
Partilhar

KevinSimback

06-16 16:07

A Fable veio e foi - foi boa?
O GLM 5.2 acabou de ser lançado - é bom?
A maioria responderá de forma anedótica, mas todos devemos criar nossas próprias avaliações pessoais
Escolha alguns fluxos de trabalho estruturados que você faz com frequência, construa um conjunto de avaliação, e depois execute-os com qualquer novo modelo como uma primeira tarefa

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-15 13:54

O enigma da inferência do consumidor:
Vejo muitos projetos de inferência orientados ao consumidor trabalhando para enfrentar o alto custo das APIs de fronteira
Os métodos variam, mas a premissa é fornecer inferência mais barata em comparação com agregadores como o OpenRouter
O desafio aqui é uma questão de timing
Hoje, os consumidores recebem IA de fronteira altamente subsidiada
Muitas opções para os consumidores obterem planos de inferência SOTA a partir de 10 dólares e os planos de 200 dólares por mês oferecem uma quantidade insana de uso
Simplesmente não há tanta demanda de consumidores por

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

KevinSimback

06-14 11:33

A prioridade número 1 para toda a indústria de IA neste momento deve ser o avanço dos modelos de código aberto baseados nos EUA
Não há razão para os EUA não terem paridade com, ou superarem, os modelos de código aberto provenientes da China

Ver original

Recompensa
gostar
Comentar
Republicar
Partilhar

Tópicos em destaque
Ver mais
#
GateCompletesDividendDistribution
512,84K Popularidade
#
StrategyBuybackSurges12%
1,38M Popularidade
#
IsraelStrikesIranBTCPlunges
67,4K Popularidade
#
PredictWorldCupShare20000U
629,14K Popularidade
#
TrumpDisclosesOver100MBTCETH
3,83M Popularidade

Fixado

KevinSimback

Tópicos em destaque

GateCompletesDividendDistribution

StrategyBuybackSurges12%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

TrumpDisclosesOver100MBTCETH

Fixado