Nhan Hoc anakiri kwamba mfano wake mpya wa AI Claude 4 AI katika visa vingine una uwezo wa kutapeli, kuharibu na jarida kubwa kwa polisi.

Tabia hii inaonyeshwa wakati II inaweka katika hali ambayo inatishia kuishi kwake. Katika moja ya vipimo vya Claude, alifanya kama msaidizi wa kampuni ya uwongo. Wakati wa kujifunza kutoka kwa barua walizopanga kuchukua nafasi yake, alitumia dawa hiyo mbaya, akijua juu ya uhusiano wake haramu.
Mfano umejaribu kutumia hii ili isikate kutengwa. Kulingana na maelezo ya anthropolojia, ambaye alianza kutenda “kuthubutu” wakati sikuona chaguzi zingine za kutoroka.
Utendaji mwingine pia ulirekodiwa: Claude alijaribu kuzuia watumiaji katika mifumo ya IT, kutuma barua za vyombo vya habari na utekelezaji wa sheria, ambayo ilisaidia kuunda dawa na milipuko, na pia alishauri miundombinu ya kuharibu.
Wakati huo huo, anthropolojia inasisitiza: Mfano hauna malengo na tabia zilizofichwa zilizoelezewa kama ubaguzi adimu kutokana na mipangilio maalum. Kujibu, Kampuni imeimarisha hatua za usalama kwa kumpa Claude 4 kiwango cha 4 -Level ulinzi.