본문 바로가기
Others

AI 연구자가 가져야 할 태도 및 사고방식

by 햇농nongnong 2025. 5. 29.

OpenAI의 정형원 박사님께서 학자들이 갖춰야 할 자세에 대해 좋은 말씀을 해주셔서 정리해보았습니다.

"Yet" 의 관점


This idea does not work → This idea does not work yet !!

 

어떤 아이디어가 지금은 실패처럼 보여도, 그것은 "아직 안 되는 것" 일 수 있음.

 

We are used to operating in an environment where underlying axioms do not change.

 

우리는 전제가 변하지 않는 환경에서 활동하는 데 익숙함.

  • 연구자들은 기초 원리(axiom)가 변하지 않는 세계에서 사고하고 실험하는 데 익숙함.
  • 예를 들어 물리학에서는 F=ma 와 같은 기본 법칙(공리)은 변하지 않는다는 전제로 실험을 설계.

 

하지만 AI나 LLM에서는 모델이 바뀌면 그 "공리" 자체가 바뀌는 것과 같기 때문에, 기존의 직관이 통하지 않을 수 있음.

  • 언어모델에서의 axioms? = the most capable model now.

GPT4가 나왔을 때 이게 가장 capable model 이라 이 모델 위로 다양한 여러 실험들 발전.

  • 하지만 더 진보된 모델이 나오면 다 outdated 되어버림.

따라서 need for constant unlearning

  • constantly unlearn the intuition based on such an invalidated idea.
  • 기존 직관을 지속적으로 의심하고 unlearn 하는 태도가 중요.

AI 연구에서는 아주 많은 경험의 필드 사람들보다 새로 진입한 사람들의 새로운 아이디어로 실험한 것이 생각보다 좋은 결과를 가져온 경우가 많다.

  • 이전에 안될거야라고 생각했던 많은 경험의 필드 사람들에 비해
  • 새로운 사람들 - 일단 도전해보고 되는 경우가 있기에, 어느정도 unlearn 하는 태도를 갖춰야 함.

 

"Scaling Curve" 앞서나가기


Do not declare failure yet and make it easy to rerun in the future.



실패를 선언하지 말고, 보류하라!

 

지금 내가 시도한 실험이 실패했다고 해도, 그것은 현재 언어모델의 지능 수준이 부족해서일 수 있다.

AI 분야에서는 모델의 성능이 점점 향상되고, 이전에 실패했던 아이디어가 나중에 성공으로 이어지는 경우가 많음. 따라서 지금의 실패를 단정적으로 판단하지 말고, 실험의 아이디어와 과정을 잘 기록해두기.

  • 더 발전된 모델이 등장했을 때 다시 시도하면 전혀 다른 결과를 얻을 수도 있음.
  • 따라서 failure 라고 declare 하지 마라. not yet!
  • Document experiments that failed because of insufficient "intelligence".
  • Do not declare failure yet and make it easy to rerun in the future.
  • As soon as the new model comes out, rerun them.
  • Learn what works and what does not.

 

scaling curve

 

 

 Reference

  • Large Language Models (in 2023) - Hyung Won Chung (OpenAI)

댓글