25년 후, @ylecun의 2015년 슬라이드는 픽셀과 다차원 보상 신호, 통증 신호를 포함한 모든 감각 입력을 예측하는 순환 신경망 "세계 모델"에 대한 1990년 논문을 다시 다루었습니다. J. Schmidhuber. 세상을 미분 가능하게 만들기: 비정지 환경에서 동적 강화 학습 및 계획을 위한 완전 순환 자기 지도 신경망 사용. 기술 보고서 FKI-126-90, TUM, 1990. https://t.co/VJvrmtsE6m 또한 후속 논문이 많이 있는 개요 웹사이트도 참조하세요: 1990 - 순환 세계 모델과 인공 호기심을 활용한 계획 및 강화 학습.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
