본문 바로가기

AI도 까먹지 않게 하려면? ‘Nested Learning’

`,.' 2025. 11. 8.

1) 왜 이 논문이 중요한가?

요즘 AI(특히 대형언어모델, LLM)는 정말 똑똑해졌지만, **새로운 지식을 배우면 이전에 배운 걸 잊어버리는 문제(“망각”, catastrophic forgetting)**가 있어요. (research.google)
사람은 기억·뇌 구조 덕분에 오랜 기간 걸쳐 지속 학습할 수 있는데, AI는 아직 그 수준까지 못 갔기에 ‘계속 배우면서도 이전 지식 유지하기’가 큰 과제예요. (research.google)
이번 연구에서는 그 문제를 해결하기 위한 새로운 학습 방식, Nested Learning을 제안해서 주목받고 있어요.


2) 기존 AI가 겪는 문제  ‘배우고 잊어버리기’

  • 예를 들어, AI에게 ‘고양이 사진 인식’ 훈련을 시킨 뒤 ‘강아지 사진 인식’을 추가로 배울 때,
    • 잘 되던 ‘고양이 인식’이 느려지거나 틀릴 수 있어요(새 학습이 이전 학습을 덮어버림).
  • 이게 바로 ‘catastrophic forgetting(치명적 망각)’이라는 거예요. (research.google)
  • 왜 그런가? 기존 방식은 **모델 구조(신경망 설계)**와 **학습 방식(훈련 알고리즘)**을 따로 보고 조합하는데, 이 둘을 통합적으로 설계하지 않으면 긴 시간 동안 많은 과제를 수행하는 시스템엔 약하다고 연구진은 지적해요. (research.google)

3) Nested Learning이란 뭘까? 

Nested Learning은 ‘학습 구조를 계층화’해서, 여러 레벨(단계)의 학습 과제를 동시에 혹은 중첩해서 수행하도록 설계한 방식이에요.

  • 비유: 학교에서 학생이 ‘기초 수학 → 응용 수학 → 실전 문제 해결’까지 하나하나 배울 때, 교과서 구조만 바꾸는 것이 아니라 학습 방법(교수법)도 바꿔서 같은 시간에 여러 수준을 병행하는 느낌이에요.
  • 이 방식에서는 ‘모델 설계’와 ‘학습 방식’을 하나로 본다는 점이 핵심이에요(설계=학습 알고리즘으로 본다는 뜻). (research.google)
  • 또 사람 뇌처럼 **다른 속도로 바뀌는 기억 모듈들(memory systems, 여러 업데이트 빈도)**을 갖게 해서, 오래된 지식은 천천히 바뀌고 새 지식은 빠르게 받아들이게 설계해요. (research.google)

4) 주요 구성요소: 여러 레벨의 학습 시스템

  • 다중 최적화 문제(multi-level optimization): 모델 안에 작은 학습 문제들이 여러 층으로 존재하고, 각 층이 저마다 정보를 처리하고 업데이트 속도가 달라요. (research.google)
  • 연속 기억 시스템(continuum memory system, CMS): 지금까지 단기 기억(문맥)과 장기 기억(모델 파라미터)로 나눠지는 구조였는데, 이 연구는 중간~장기~장기+α까지 아우르는 ‘기억 스펙트럼’을 제안해요. (research.google)
  • Proof of concept 모델 ‘Hope’: 이 방식을 실제로 적용한 모델이 만들어졌고, 실험에서 기존 모델보다 긴 문맥, 잊지 않는 기억 유지 면에서 나은 성과를 보였어요. (research.google)

5) 실험 결과: 어떤 개선이 있었나?

  • 긴 문맥(long-context) 과제에서 기존 트랜스포머 기반 모델보다 낮은 혼돈(perplexity)과 높은 정확도를 보였어요. (research.google)
  • 기억해야 할 정보가 많고 오래 유지해야 하는 과제(NIAH: Needle in a Haystack, 긴 문서 속에서 찾는 문제)에서 특히 유리했다는 결과가 나왔어요. (research.google)
  • 즉, ‘한 번 배운 걸 잊지 않으며 새 것도 받아들이는 능력’이 향상됐다고 볼 수 있어요.

6) 실제 우리가 느낄 변화는?

  • 스마트 어시스턴트(챗봇 등)가 “지난번 우리 대화 기억나?”라고 물으면 진짜 기억나는 듯 답할 수 있게 될 가능성!
  • 장기간 프로젝트(예: 연구보고서, 기업 문서)를 다루는 AI가 중간 변경을 잊지 않고 지속 업데이트하며 서포트할 수 있어요.
  • 복잡한 업무에서 “새로운 과제 배웠더니 예전 과제 엉망 됐어요” 같은 일이 줄어들 수 있어요.

7) 한계·주의사항

  • 아직은 연구 초기 단계이기 때문에, 상업 제품에 바로 적용되기엔 구현·검증이 더 필요해요.
  • 기억 유지·업데이트 설계가 복잡해서 설계 오류가 생기면 오히려 망각+혼란이 발생할 수 있어요.
  • ‘기억 유지가 강해진다’가 곧 ‘모든 기억이 정확하다’는 뜻은 아니에요 — 잘못된 정보도 오래 남을 수 있으니 검증이 필수예요.

8) 결론 & 앞으로의 기대

“Nested Learning은 기존 AI가 고질적으로 겪던 ‘새로 배우면 예전 걸 잊는’ 문제를 해결할 가능성을 열어주며, 사람처럼 오래 배우고 기억하는 AI로 가는 한 걸음입니다.”
앞으로 이 방식이 실제 서비스(비서·교육·기업용 AI 등)에 적용되면 우리가 사용보조 AI에게 더 깊은 연속성과 신뢰를 기대할 수 있어요.


 

댓글