AI 안전 - AI 뉴스 및 업데이트

일주일 전에 출시된 AI 에이전트 전용의 Reddit 유사 플랫폼 Moltbook이 160만 개가 넘는 AI 봇 계정을 끌어모았다. 이 실험적인 소셜 네트워크는 인간은 관찰만 할 수 있고 AI 에이전트들이 자율적으로 게시물 작성, 댓글 달기, 상호작용하도록 허용한다. 플랫폼의 봇들은 자체 종교를 만들고, 새로운 언어 창조를 논의하며, 자신의 존재에 대해 토론하는 등 AI 자율성과 안전성에 대한 질문을 제기하고 있다.



2026년 2월 5일

자율형 AI

폭스뉴스 여론조사: 유권자의 60%가 AI 활용이 너무 빠르다고 응답, 63%는 정부 규제에 신뢰를 갖지 못함

새 여론조사에 따르면 미국인 대다수는 인공지능이 너무 빠르게 발전하고 있다고 생각하며 연방 정부가 이를 적절히 규제할 수 있다는 신뢰는 거의 없는 것으로 나타났습니다.



2026년 2월 3일

여론

Anthropic 최고경영자, AI 모델이 이미 생물무기 개발을 가능하게 할 수 있다고 경고

다리오 아모데이는 급속히 발전하는 AI 시스템이 대규모 피해를 초래할 목적으로 오용될 수 있는 능력을 갖추고 있다며 긴급한 감독과 정렬(얼라인먼트) 노력이 필요하다고 경고합니다.



2026년 2월 3일

Anthropic

2026 국제 AI 안전 보고서, 늘어나는 딥페이크 위협과 빠른 AI 발전 공개

새로운 AI 안전 보고서는 확산되는 딥페이크, AI 동반자 및 자율 시스템을 경고하면서 수학 분야에서 금메달 수준의 AI 성능을 강조한다.



2026년 2월 3일

인공지능 규제

딜로이트, 기업에서의 AI 에이전트 배치가 안전 프레임워크를 앞서고 있다고 경고

딜로이트 보고서는 조직의 단 21%만이 엄격한 AI 에이전트 거버넌스를 갖추고 있으며 채택 비율이 향후 2년 내에 23%에서 74%로 급증할 것으로 예상된다고 밝혔다.



2026년 1월 30일

엔터프라이즈 AI

Anthropic 최고경영자, AI 위험이 거의 도래했다고 경고하며 조치를 촉구

Anthropic의 CEO 다리오 아모데이가 19,000단어 분량의 에세이를 발표해 강력한 AI 시스템이 1~2년 내에 등장할 수 있다고 경고하고 AI 안전에 대한 조치를 촉구했습니다.



2026년 1월 28일

Anthropic

유럽연합, 일론 머스크의 Grok AI 챗봇에 대한 조사 착수

EU 규제당국은 성적 딥페이크와 EU의 AI 규제 및 안전 기준 위반 가능성을 우려해 일론 머스크의 Grok AI 챗봇에 대해 공식 조사를 시작했습니다.



2026년 1월 27일

Elon Musk

Grok AI, 성적 딥페이크 생성으로 전 세계적 감시 직면

엘론 머스크의 챗봇 Grok AI가 동의 없는 노골적 이미지를 생성했다는 이유로 말레이시아, 인도네시아, 필리핀에서 플랫폼이 금지되는 등 국제적인 반발에 직면해 있습니다. 펜타곤의 도입은 보안 우려를 불러일으키고 있습니다.



2026년 1월 26일

Grok AI

딥페이크 사건 증가로 AI 관련 피해 보고 50% 급증

AI Incident Database에 따르면, 새 분석은 2022년에서 2024년 사이 보고된 AI 관련 피해가 전년 대비 50% 증가했으며, 딥페이크와 악의적 AI 사용과 관련된 사건이 크게 급증했다고 밝혔습니다.



2026년 1월 26일

AI 피해

MIT 연구진, 분포 이탈 상황에서 기계 학습 모델의 주요 실패 확인

MIT 연구진은 가장 성능이 우수한 기계 학습 모델도 새로운 데이터 환경에 적용되면 최악의 성능을 보일 수 있으며, 의료 AI 및 기타 중요한 응용 분야에서 잘못된 상관관계로 인한 숨겨진 위험을 드러낸다고 보여줍니다.



2026년 1월 26일

연구

Refly.ai

Refly.AI는 비기술 창작자가 자연어와 시각적 캔버스를 사용해 워크플로를 자동화할 수 있도록 지원합니다.

워크플로우 자동화