안정적인 확산의 비밀은 바로 드로잉이 아니라, 노이즈 제거에 있었다는 것입니다! --- 안정적 확산을 사용했을 수도 있습니다. "고양이가 소파에 앉아 있다"라고 입력하면, 그런 다음 진행률 표시줄을 보면서 조금씩 전진하세요. 10%... 20%... 30%... 그 이미지는 점점 더 명확해졌습니다. 처음에는 모두 소음이었습니다. 그러면 몇몇 모양이 희미하게 보일 겁니다. 그러면 고양이의 윤곽을 볼 수 있습니다. 마침내 선명한 그림이 나타났습니다. 실제로 무슨 일이 일어나는지 궁금해 본 적이 있나요? 정답은 소음 감소입니다. 그림을 "그리는" 것이 아닙니다. "소음 감소"입니다. 우선, 순수한 노이즈 그래프를 제시해 보겠습니다. TV에 신호가 없을 때 나타나는 정지 화면과 같습니다. 그런 다음 점차적으로 소음을 제거합니다. 각 비트가 제거될 때마다 이미지가 더욱 선명해집니다. 50걸음 지나자 이미지가 선명해졌습니다. 이것은 DDPM: 잡음 제거 확산 확률 모델입니다. (노이즈 제거 확산 확률 모델) 복잡하게 들리지만 핵심은 단 두 단어, 소음 감소입니다. 하지만 여기에는 마법같은 장소가 있습니다. 어떤 종류의 결과를 얻어야 할지 어떻게 알 수 있나요? 내 말은, 똑같은 소음이에요. 고양이에게 갈 수도 있고, 개에게 갈 수도 있고, 차에게 갈 수도 있어요. 당신이 고양이를 원한다는 것을 어떻게 알 수 있나요? 답은: 당신이 말했잖아요. "고양이가 소파에 앉아 있다"라고 입력했습니다. 이 텍스트는 벡터로 변환됩니다. 그런 다음 각 소음 감소 단계 동안 모든 모델은 이 벡터를 살펴볼 것입니다. 알겠습니다. 아, 당신은 개가 아니라 고양이를 원하는군요. 따라서 소음 감소는 "고양이"에 맞춰져 있습니다. 그래서 여러분은 다른 텍스트를 입력하는 거예요. 다양한 그래프가 생성됩니다. 소음 감소에 대한 접근 방식이 다르기 때문입니다. 그리고 이 모든 것은 간단한 아이디어에 기초하고 있습니다. 생성은 본질적으로 역방향 잡음 제거입니다. 먼저, 노이즈를 추가하는 방법을 알아보세요. 그러면 반대로, 노이즈를 제거하는 방법을 배워보세요. 소음 감소의 궁극적인 목표는 생성된 결과입니다. 이 논문은 2020년의 획기적인 논문입니다. 그 이후로 모든 최고의 이미지 생성 모델이 안정 확산, 중간 여정, DALL-E 2, 모든 것에 이 방법을 적용하세요. GAN이 아니라 확산이에요. 확산은 더 안정적이고, 더 제어하기 쉬우며, 더욱 사실적인 이미지를 생성합니다. 또한, Stable Diffusion을 사용했을 때 다음 매개변수를 조정했을 수 있습니다. 단계: 50 CFG 척도: 7.5 샘플러: DPM++ 2M Karras 코드가 성공적으로 실행되었고 그래프가 생성되었습니다. 하지만 여러분은 이러한 매개변수가 무엇을 의미하는지 모를 수도 있습니다. 단계는 노이즈 감소 단계의 수를 나타냅니다. 안정 확산은 한 번에 그래프를 생성하지 않습니다. 단계별로 노이즈를 제거합니다. 단계 = 50은 노이즈를 50번 제거하는 것을 의미합니다. 제가 방문할 때마다 지도가 조금씩 더 명확해집니다. 단계가 많을수록 다이어그램은 더 명확해지지만 속도는 느려집니다. 단계가 적을수록 이미지는 흐릿해지지만 더 빨라집니다. 일반적으로 50걸음이면 충분합니다. CFG 스케일은 텍스트 가이드의 강도입니다. CFG는 분류자 없는 지침입니다. 이는 입력한 텍스트가 생성된 결과에 얼마나 큰 영향을 미치는지를 의미합니다. CFG Scale = 1인 경우 텍스트는 거의 영향을 받지 않으며 모델을 임의로 생성할 수 있습니다. CFG 척도 = 20, 텍스트가 상당한 영향을 미치며, 모델은 텍스트에 따라 엄격하게 생성됩니다. CFG Scale = 7.5는 균형입니다. 텍스트를 읽는 것과 약간의 창의성이 모두 필요합니다. 너무 낮으면 생성된 이미지와 텍스트가 일치하지 않습니다. 해상도가 너무 높으면 딱딱하고 영감이 없는 이미지가 생성됩니다. 샘플러는 노이즈를 줄이는 방법입니다. DDPM은 "1000배 소음 감소"를 의미합니다. 하지만 1000번은 너무 느립니다. 그래서 나중에 누군가가 더 빠른 방법을 발명했습니다. DPM++, 오일러, DDIM... 이는 모두 "더 빠르게 소음을 제거하는 방법"에 대한 것입니다. 어떤 방법은 단 20단계만으로 1000단계의 효과를 얻을 수 있습니다. 어떤 방법은 더 안정적이다. 더욱 창의적인 방법도 있습니다. 선택하는 샘플러에 따라 노이즈 제거 방법이 결정됩니다. 이것이 이러한 매개변수의 의미입니다. 단계: 노이즈를 여러 번 제거합니다. CFG 척도: 텍스트의 영향은 얼마나 큰가요? 샘플러: 노이즈 감소에는 어떤 방법을 사용하나요? ---- AI가 생성한 읽기 쉬운 과학 기사는 복잡한 개념을 배우는 데 이상적입니다.
스레드를 불러오는 중
깔끔한 읽기 화면을 위해 X에서 원본 트윗을 가져오고 있어요.
보통 몇 초면 완료되니 잠시만 기다려 주세요.