blog.cloudflare.com/18-november-20… 다들 사고 보고서를 분석하고 있으니, 나도 한번 살펴보도록 할게요. AI가 간단한 분석을 수행하게 하세요. 1. ClickHouse 데이터베이스의 권한을 변경했습니다(매우 사소하고 일상적인 작업). 2. 권한이 변경되자 ClickHouse의 쿼리 동작이 변경되어 Bot Management 기능 파일을 생성할 때 동일한 데이터 행이 수만 번 기록되었습니다. 3. 일반적으로 이 기능 파일은 몇 MB 정도에 불과하지만 이번에는 몇 배나 커졌습니다. 4. 전 세계 수십만 개의 엣지 서버가 몇 분마다 최신 기능 파일을 자동으로 가져옵니다. 5. 서버에서 실행되는 Bot Management 모듈 코드에는 하드코딩된 크기 제한이 있습니다. 6. 파일 수가 이 한도를 초과하면 Bot Management 모듈이 충돌하거나 로드를 거부합니다. 7. 이 모듈이 충돌하면 전체 핵심 프록시 시스템(Frontline, FL 및 FL2라고도 함)을 사용할 수 없게 됩니다. 분석 결과를 검토해 보니, 이렇게 거대한 시스템에서 문제를 피하는 것은 엄청나게 어렵다는 것을 깨달았습니다. 너무 복잡해서 아무도 모든 세부 사항을 완벽하게 이해할 수 없습니다. 감히 말씀드리자면, 이 설정 코드를 작성한 사람은 봇 관리팀이 하드코딩된 크기 제한을 작성했다는 사실조차 모를 것입니다. 시스템이 클수록 "기본적인 실수"로 인해 무너질 가능성이 더 큽니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.