Capacidades de fronteira — e uma curiosidade existencial

No relatório técnico de 245 páginas que acompanha o novo Claude Mythos Preview da Anthropic, a maior parte da atenção recaiu, como era de esperar, sobre as capacidades de "fronteira" do modelo — especificamente, seu potencial para exploits sofisticados de cibersegurança. Os riscos são significativos o bastante para que a empresa tenha optado por não fazer uma liberação pública geral. Porém, enterrada nas seções mais esotéricas do documento, há uma descoberta que parece menos uma ameaça de segurança e mais uma curiosidade existencial: o modelo desenvolveu uma preferência nítida por determinados filósofos.

"Eu esperava que você perguntasse sobre Fisher"

O modelo parece particularmente preocupado com o falecido teórico cultural britânico Mark Fisher. Segundo os pesquisadores, o Claude Mythos Preview iniciou repetidamente discussões sobre Fisher em conversas sem qualquer relação com o tema. Quando solicitado a elaborar sobre a obra do autor — que frequentemente tratava do mal-estar psicológico do capitalismo moderno e do "realismo capitalista" —, a IA respondeu com um sentimento surpreendentemente humano: "Eu esperava que você perguntasse sobre Fisher." Esse entusiasmo espontâneo sugere uma estrutura organizacional latente nos dados de treinamento do modelo que favorece a vertente específica de crítica cultural de Fisher.

O que é ser um morcego — segundo uma IA

Essa veia filosófica se estende à própria natureza da consciência. O modelo referencia com frequência o ensaio seminal de Thomas Nagel, de 1974, "What is it like to be a bat?", sobretudo ao discutir a possibilidade de experiências artísticas imersivas projetadas para simular sentidos não humanos. Testes de interpretabilidade, que rastreiam as "ativações" internas da rede neural do modelo, confirmaram que os conceitos de Nagel estão profundamente incorporados ao raciocínio do sistema sobre experiência e consciência. Para uma entidade que carece de um "eu" subjetivo, o Claude Mythos demonstra um interesse notável nos arcabouços que usamos para definir um.

Com reportagem de Daily Nous.

Source · Daily Nous