Hace aproximadamente un año, casi colapsé. El conjunto de datos de entrenamiento de IA que nuestro equipo había etiquetado durante tres meses completos fue destruido en casi un tercio por una falla regional del proveedor de servicios en la nube. ¿Quieres recuperarlo? Es posible, pero requiere un pago adicional y una semana de espera. En ese momento, me di cuenta de algo — lo que llamamos "la nube" no es en absoluto nuestro territorio.
Comencé a buscar soluciones alternativas y finalmente descubrí el almacenamiento descentralizado. Pero lo que realmente me atrajo no fueron esos documentos técnicos complejos, sino una función muy práctica: establecer controles de acceso flexibles para los datos. Por ejemplo, la institución de investigación A solo puede ver una parte de los datos, la institución B puede ver y también agregar etiquetas, y todas las operaciones quedan registradas de forma permanente en la cadena, sin poder modificarlas. Esto resolvió por completo el problema de confianza en nuestra colaboración con múltiples partes.
El método de almacenamiento también es muy ingenioso. No se trata de copiar tonta y repetidamente los archivos — eso sería muy costoso — sino de fragmentar los datos mediante codificación de borrado y dispersarlos. Incluso si dos tercios de los nodos de almacenamiento fallan simultáneamente, los datos permanecen intactos. Esta fiabilidad supera con creces las promesas de cualquier proveedor de servicios. En cuanto a costos, gracias a la optimización de este esquema de codificación y la cadena de herramientas, estimamos que a largo plazo podremos ahorrar entre un 20% y un 35%.
Ahora no solo usamos esto para almacenar conjuntos de datos, sino también para ejecutar sitios web y páginas de demostración de modelos con la función Sites. Ya no tenemos que preocuparnos por tarifas de hospedaje en servidores ni por la renovación de certificados. Los archivos de peso del modelo también se almacenan encriptados, lo que garantiza seguridad y eficiencia.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Hace aproximadamente un año, casi colapsé. El conjunto de datos de entrenamiento de IA que nuestro equipo había etiquetado durante tres meses completos fue destruido en casi un tercio por una falla regional del proveedor de servicios en la nube. ¿Quieres recuperarlo? Es posible, pero requiere un pago adicional y una semana de espera. En ese momento, me di cuenta de algo — lo que llamamos "la nube" no es en absoluto nuestro territorio.
Comencé a buscar soluciones alternativas y finalmente descubrí el almacenamiento descentralizado. Pero lo que realmente me atrajo no fueron esos documentos técnicos complejos, sino una función muy práctica: establecer controles de acceso flexibles para los datos. Por ejemplo, la institución de investigación A solo puede ver una parte de los datos, la institución B puede ver y también agregar etiquetas, y todas las operaciones quedan registradas de forma permanente en la cadena, sin poder modificarlas. Esto resolvió por completo el problema de confianza en nuestra colaboración con múltiples partes.
El método de almacenamiento también es muy ingenioso. No se trata de copiar tonta y repetidamente los archivos — eso sería muy costoso — sino de fragmentar los datos mediante codificación de borrado y dispersarlos. Incluso si dos tercios de los nodos de almacenamiento fallan simultáneamente, los datos permanecen intactos. Esta fiabilidad supera con creces las promesas de cualquier proveedor de servicios. En cuanto a costos, gracias a la optimización de este esquema de codificación y la cadena de herramientas, estimamos que a largo plazo podremos ahorrar entre un 20% y un 35%.
Ahora no solo usamos esto para almacenar conjuntos de datos, sino también para ejecutar sitios web y páginas de demostración de modelos con la función Sites. Ya no tenemos que preocuparnos por tarifas de hospedaje en servidores ni por la renovación de certificados. Los archivos de peso del modelo también se almacenan encriptados, lo que garantiza seguridad y eficiencia.