El vídeo de Fukushima (1986) muestra una CNN que reconoce dígitos escritos a mano [3], tres años antes del vídeo de LeCun (1989). Cronología de CNN tomada de [5]: ★ 1969: Kunihiko Fukushima publicó las unidades lineales rectificadas o ReLU [1] que ahora se utilizan ampliamente en las CNN. ★ 1979: Fukushima publicó la arquitectura básica de la CNN con capas de convolución y capas de submuestreo [2]. La llamó neocognitrón. Se entrenaba mediante reglas de aprendizaje no supervisado. La computación era 100 veces más cara que en 1989 y mil millones de veces más cara que hoy. ★ 1986: Vídeo de Fukushima sobre el reconocimiento de dígitos escritos a mano [3]. ★ 1988: Wei Zhang et al. desarrollaron la primera CNN bidimensional "moderna" entrenada mediante retropropagación y la aplicaron al reconocimiento de caracteres [4]. El coste computacional era aproximadamente 10 millones de veces superior al actual. ★ 1989-: trabajos posteriores de otros [5]. REFERENCIAS (más en [5]) [1] K. Fukushima (1969). Extracción de características visuales mediante una red multicapa de elementos de umbral analógicos. IEEE Transactions on Systems Science and Cybernetics. 5 (4): 322-333. Este trabajo introdujo las unidades lineales rectificadas o ReLU, ampliamente utilizadas en las CNN y otras redes neuronales. [2] K. Fukushima (1979). Modelo de red neuronal para un mecanismo de reconocimiento de patrones inafectado por el desplazamiento de posición: Neocognitron. Trans. IECE, vol. J62-A, n.º 10, págs. 658-665, 1979. La primera arquitectura de red neuronal convolucional profunda, con capas convolucionales alternas y capas de submuestreo. En japonés. Versión en inglés: 1980. [3] Película producida por K. Fukushima, S. Miyake y T. Ito (NHK Science and Technical Research Laboratories), en 1986. YouTube: https://t.co/MUyH81L5wD [4] W. Zhang, J. Tanida, K. Itoh, Y. Ichioka. Red neuronal de reconocimiento de patrones invariante al desplazamiento y su arquitectura óptica. Proc. Conferencia Anual de la Sociedad Japonesa de Física Aplicada, 1988. Primera CNN bidimensional "moderna" entrenada por retropropagación, aplicada al reconocimiento de caracteres. [5] J. Schmidhuber (AI Blog, 2025). ¿Quién inventó las redes neuronales convolucionales?
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.