[1/7] LobeChat Cloud (hlobechat.com lleva más de tres meses en beta pública y hemos alcanzado nuestro segundo 🏁 hito de ix.com/arvin17x/statu…iré las cifras específicas para no parecer que estoy vendiendo ansiedad 🤣), así que ¡hablemos de nuestra experiencia práctica de los últimos tres meses! ¡Vamos~ 🚀!
[2/7] Primero, hablemos del producto. Durante los últimos tres meses, mi mayor convencimiento es que deberíamos desarrollar más funciones nuevas. Cada función importante puede atraer nuevos grupos de usuarios: la nueva base de conocimientos lanzada en agosto y los Artefactos lanzados en septiembre atrajeron una gran cantidad de usuarios incrementales. Sin embargo, como no hubo nuevas funciones en octubre, solo realizamos optimizaciones relacionadas con las suscripciones y hubo relativamente poca promoción, el ritmo de crecimiento se ha ralentizado significativamente. Por lo tanto, nos esforzaremos por aumentar el ritmo de iteración a una función importante al mes para que todos puedan percibir intuitivamente el progreso del producto. La función de este mes será el "diálogo de rama" que muchos esperan con ansias (¡la he deseado durante mucho tiempo! 😆).
[3/7] Durante este período, creo que uno de nuestros mayores avances ha sido la mejora integral de las capacidades de nuestra API Gateway. Gracias al proyecto de código abierto de primer nivel LiteLLM, hemos mejorado significativamente la estabilidad de nuestras API de IA. LiteLLM no solo admite el balanceo de carga multicanal y el control bajo demanda de la conmutación de tráfico, sino que también admite reintentos y respaldo continuo en caso de fallo. 👍 Por ejemplo, al usar Claude 3.5 sonnet, actualmente utilizamos dos claves API directas oficiales de nivel 4 para el balanceo de carga. Si la carga es insuficiente, recurrimos automáticamente al canal oficial de AiHubMix. Actualmente, mientras la API oficial de Claude no se bloquee, podemos garantizar que la estabilidad del canal de modelos de Claude alcance el 100 % 😎 (y para solucionar el problema de que la API oficial pueda fallar, recientemente contactamos con los responsables de GCP para abrir una cuenta, lista para servir como canal de respaldo para la API oficial de Anthropic en el futuro 😏). Al mismo tiempo, el mes pasado también dedicamos tiempo a desarrollar un Kuma, equipado con monitoreo completo de modelos de IA, y realizamos monitoreo de latidos de solicitudes reales para cada modelo. Dado que la mayoría de nuestros canales están conectados directamente a la API oficial, podemos ver a través de la prueba de latidos que el retraso promedio de las solicitudes es de tan solo 1 s ⚡️. La experiencia de conversación de los usuarios finales está efectivamente garantizada 😆
[4/7] Ahora, hablemos de los costos del producto. A diferencia de muchos emprendedores de internet, somos bastante conscientes de los costos. Al fin y al cabo, al ser un equipo pequeño, no teníamos mucha inversión disponible, así que realizamos muchos cálculos de estructura de costos desde el principio. Supongamos que añadimos 100,000 nuevos usuarios. ¿Cuánto tráfico, costos de computación, costos de autenticación y costos de almacenamiento se consumirían? ¿A cuánto ascendería eso en plataformas como Vercel, Neon, Clerk y Cloudflare? ¿Cuánto multiplicaríamos ese precio para obtener nuestro margen de beneficio y, en última instancia, nuestro precio de venta? De esta manera, podemos estar seguros de que si el tráfico de nuestro producto se multiplica por diez repentinamente, nuestra infraestructura actual seguirá siendo capaz de gestionar ese tráfico y multiplicar por diez nuestras ganancias.
[5/7] Tomemos como ejemplo Clerk. Tras ejecutarlo en la nube, descubrimos que Clerk es prácticamente la mejor práctica de autenticación SaaS para implementaciones internacionales, y su facturación no es tan desorbitada como muchos creen. Muchos piensan que los $0.02 MAU de Clerk son carísimos. Si tienes 20,000 MAU, tendrías que pagar $100 al mes. Si tienes 100,000 MAU, tendrías que pagar $2,000 al mes. Entonces, ¿trabajas básicamente para Clerk? Pero no es así en absoluto. Los MAU facturables reales de Clerk se calculan en función de un "segundo inicio de sesión". La mayoría de los usuarios podrían simplemente visitar tu producto por primera vez y luego abandonarlo, sin volver jamás. Clerk no factura a estos usuarios. Solo los usuarios verdaderamente activos se contabilizan como MAU. Por ejemplo, en la nube, actualmente tenemos 24.000 usuarios registrados, pero Clerk solo nos factura unos 3.000 MAU. Esto significa que, para alcanzar el objetivo de Clerk de 10.000 MAU, nuestra base total de usuarios probablemente tendría que alcanzar los 80.000. Con nuestra tarifa actual, triplicar nuestra base de usuarios sería más que suficiente para generar un flujo de caja estable y rentable. Además, con el modelo de costes de Clerk, capturamos de forma natural los datos clave del embudo de comportamiento del usuario (registro -> activo -> pagado). El uso de autenticación propia para los datos de este embudo probablemente generaría costes adicionales. En cuanto al desglose de costes de otros servicios fundamentales (Neon, Vercel, etc.), tengo previsto abrir un hilo aparte para hablar de ello más adelante, ¡así que estén atentos!
[6/7] Finalmente, hablemos de pagos. En agosto, nos topamos con nuestro primer problema de control de riesgos. Dos órdenes de pago fueron disputadas. Posteriormente, descubrimos que alguien había robado tarjetas de crédito. Hasta la fecha, se han dado tres casos similares. El entorno de pagos en el extranjero no es tan seguro como en China. Estas tres disputas relacionadas con tarjetas de crédito robadas nos han hecho perder casi 100 $ 🥲. Por lo tanto, se recomienda encarecidamente que todos estén al tanto del Radar de Stripe; de lo contrario, existe una alta probabilidad de encontrar problemas como pagos robados y disputas. Cuando Stripe les indique que deben revisar ciertas órdenes de pago, se recomienda enviar una consulta por correo electrónico a la cuenta lo antes posible. Si no reciben respuesta en un plazo determinado, inicien directamente un reembolso y márquenlo como fraude. Esto puede reducir considerablemente la posibilidad de disputas posteriores. Además, la fiscalidad se ha convertido en un problema al que debemos prestar atención. Actualmente estamos registrando una por una (Reino Unido, UE, etc.) y la compartiremos con todos cuando tengamos la experiencia completa.
[7/7] Bueno, eso es todo lo que he aprendido en los últimos tres meses. Este camino no ha silobechat.comábamos, pero por suerte lo hemos superado. Finalmente, les damos la bienvenida a todos a probar LobeChat, ya sea la versión de código abierto o la versión en la nube (https://t.co/z4k5TITVKc). Agradecemos sus críticas y sugerencias y nos esforzamos por mejorarlo aún más. 💪 Cuando alcancemos el siguiente hito ⛳️, compartiremos nuestros nuevos conocimientos con todos.