‘2025 인공지능 안전 서울 포럼(SFASS)’이 10월 28일부터 29일까지 이틀간 서울 호텔 나루 엠갤러리에서 열린다. 이번 포럼은 ‘보다 안전한 인공지능 세상을 향한 글로벌 협력(Global Cooperation for a Safer AI Future)’을 주제로, 전 세계 AI 안전 전문가들이 한자리에 모여 인공지능 안전 거버넌스, 평가, 레드티밍(red teaming)* 등 AI 안전의 핵심적인 부분들을 깊이 있게 논의한다.

이 포럼을 통해 시민들은 AI 안전이 어떻게 강화될 수 있는지, 그리고 한국이 이 분야에서 어떤 역할을 하게 될지에 대한 구체적인 정보를 얻을 수 있다. 특히 AI 시스템의 위험을 식별하고 평가하며 완화하기 위한 기술적 접근 방법을 모색하고, 국가 간 AI 안전 거버넌스 협력 체계를 공고히 하는 국제적 논의를 한국이 주도적으로 이끌어간다는 점에서 큰 의미를 지닌다.

포럼에는 국내외 학계, 산업계, 정부 관계자 등 150여 명의 전문가가 참여한다. 행사 첫날인 28일에는 각국의 인공지능안전연구소(AISI)의 활동, 프론티어 AI 모델 개발 기관의 노력, AI 평가 전문 기관의 평가 체계와 방법 등이 소개된다. 일본, 싱가포르, 유럽연합(EU) 등의 AISI 소장들이 참여하여 각 기관의 성과와 계획, 그리고 국제 협력 방안을 논의할 예정이다. 또한 LG AI연구원, 네이버 클라우드, 앤트로픽(Anthropic), 구글(Google) 등 국내외 AI 개발 기업 및 기관들이 참여하여 AI 모델의 안전성 확보와 평가 체계에 대한 논의를 이어간다. 한국 인공지능안전연구소 실무책임자들은 ‘Korea AISI 대화 세션’을 통해 한국의 AI 안전 평가, 정책, 연구 추진 방향을 공유할 것이다.

둘째 날인 29일에는 AI 안전 평가 방법론을 주제로 한 기술 중심의 워크샵이 진행된다. 엠엘커먼스(MLCommons), METR, 앤트로픽(Anthropic), 에포크 AI(Epoch AI), FLI(Future of Life Institute), 옥스퍼드 대학(Oxford University) 등 세계 주요 AI 평가 기관 및 연구자들이 세션 연사로 참여한다. 또한 이날 워크샵에서는 프론티어 AI 모델을 대상으로 한 실습 기반의 레드티밍 세션이 진행될 예정이다. 특히 한국 인공지능안전연구소와 미국 AI 전문 기업 스케일 AI(Scale AI) 간의 MOU 체결식이 열려 AI 안전 연구와 평가 협력의 글로벌 기반을 더욱 강화할 계획이다.

*레드티밍(red teaming)은 모의 공격을 통해 AI 모델의 취약점, 편향, 악용 가능성을 검증하고 위험 요인을 선제적으로 식별 및 개선하는 과정으로, AI 안전 관리의 핵심 절차로 자리 잡고 있다.

행사는 과학기술정보통신부(과기정통부)가 주최하고, 한국전자통신연구원 인공지능안전연구소가 주관한다. 포럼의 모든 일정은 10월 28일부터 29일까지 호텔 나루 서울 엠갤러리(나루볼룸)에서 진행된다.