@andy_l_jones가 쓴, 오래되었지만 좋은 책인 '보드 게임으로 스케일링 법칙 확장하기(2021)'를 읽고 있었습니다. 이는 추론 확장을 예상한 것으로 유명합니다. 하지만 그게 이 논문에서 가장 흥미로운 발견은 아니었습니다! 앤디는 훈련 컴퓨팅, 테스트 시간 컴퓨팅, 문제 복잡성이라는 세 가지 다른 요소 간의 관계를 탐구하고 있습니다. 그리고 문제의 복잡성(게임판의 크기)에 대한 그의 연구 결과가 가장 흥미롭습니다. 예를 들어, 게임 보드 크기가 커짐에 따라 무작위 플레이에서 완벽한 플레이로 전환하는 계산이 어떻게 확장되는지 궁금할 수 있습니다. 그리고 그는 그 크기가 같다는 것을 발견했습니다! 연산 능력이 10배 증가하면 게임 보드의 크기에 관계없이 Elo 점수가 500점 더 높아집니다. 이상하네요! 문제가 어려워질수록 점진적인 진전이 훨씬 더 어려워진다는 이야기를 할 수도 있었을 텐데, 사실은 그렇지 않네요. 이러한 발견이 다른 도메인에도 일반화되는지, 아니면 앤디가 훈련하고 있는 게임인 Hex의 검색 공간에서만 나타나는 결과인지에 대한 공개적인 증거는 본 적이 없습니다. 하지만 만약 일반화된다면 AGI에 극적인 영향을 미칠 것입니다. 세상은 엄청나게 복잡합니다. 바둑이나 체스보다 훨씬 더 복잡하죠. 그래서 10배 더 높은 연산 능력을 가진 인간 수준의 AI가 여전히 인간 수준에 머물 것이라고 생각했을지도 모릅니다. 하지만 실제로는 동네 바보에서 초인공지능(ASI)으로 급등하는 데 필요한 연산 능력의 상대적 증가는 알파고가 3,000 엘로에서 3,500 엘로로 승률을 올리는 데 필요한 것과 같은 수준일지도 모릅니다. (엘로의 선형적 증가는 승률의 기하급수적 증가를 의미한다는 점을 명심하세요.) 분명히 말씀드리자면, 우리는 아직 마을 바보 수준과는 거리가 멀다고 생각합니다. 하지만 일단 그 수준에 도달하면, 초인공지능(ASI)에 도달하는 데 훨씬 더 강력한 연산 능력만 필요할지도 모릅니다. --- 다른 흥미로운 내용은 다음과 같습니다. 1. 더 높은 지능은 단지 더 많은 전략의 집합체일 뿐일까요? 아니면 그 중심에는 하나의 응집력 있고 원자적인 것이 있을까요? 적어도 Hex에서는 전자인 것 같습니다. 성능이 연산량에 따라 확장되는 방식은 상대보다 연산량이 두 배 많은 에이전트가 약 3분의 2의 확률로 승리할 수 있다는 것입니다. 이러한 행동은 각 플레이어가 자신이 연산한 만큼의 난수를 선택하고, 가장 높은 숫자를 선택한 플레이어가 승리하는 장난감 모델과 매우 유사합니다. 이 장난감 모델에서 연산량을 두 배로 늘리면 뽑는 난수의 수도 두 배로 늘어나고, 가장 큰 숫자를 가질 확률은 3분의 2입니다. 이는 Hex의 복잡한 게임 플레이가 실제로는 각 에이전트가 연산량에 비례하는 전략 '풀'을 가지고 더 나은 전략을 선택하는 쪽이 승리하는 방식으로 축소될 수 있음을 시사합니다. 2. 이에 대해 좀 더 생각해 보고 싶습니다. "저희는 테스트 시점 컴퓨팅이 학습 시점 컴퓨팅보다 훨씬 '저렴'하다고 직감했기 때문에, 둘 중 하나가 다른 하나를 쉽게 대체할 수 있다는 사실에 놀랐습니다. 하지만 곰곰이 생각해 보니, 핵심적인 차이점은 테스트 시점 최적화는 하나의 샘플만 최적화하면 되는 반면, 학습 시점 컴퓨팅은 전체 샘플 분포를 최적화해야 한다는 것입니다." --- 어쨌든, 끝까지 읽어볼 만한 가치가 충분히 있습니다. 아래 링크를 참조하세요.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.
