/* eslint-disable */
/* blog/data-is-not-software.jsx — article page */

const IMG = './data-is-not-software/';

const AnthropicScreenshot = ({ lang }) => (
  <figure className="tm-article-fig">
    <img
      src={IMG + 'anthropic-screenshot.png'}
      alt={lang === 'en'
        ? "Screenshot of Anthropic's blog showing the 'Data is not software' section, June 2026"
        : "Captura del blog de Anthropic mostrando la sección 'Data is not software', junio 2026"}
      className="tm-article-img"
    />
    <figcaption className="tm-article-figcaption">
      Screenshot: Anthropic&rsquo;s blog, June 2026 &mdash; &lsquo;Data is not software&rsquo;
    </figcaption>
  </figure>
);

const DiagramComparison = ({ lang }) => (
  <div className="tm-article-diagram">
    <img
      src={IMG + 'diagram-comparison.svg'}
      alt={lang === 'en'
        ? 'Architecture comparison: Teramot data lakehouse vs traditional AI-on-top-of-data approach'
        : 'Comparación de arquitecturas: data lakehouse de Teramot vs enfoque tradicional de IA sobre datos'}
      className="tm-article-img"
    />
  </div>
);

const ArticleEN = () => (
  <article className="tm-article">
    <header className="tm-article-header">
      <a href="../blog.html" className="tm-article-back">← Blog</a>
      <h1 className="tm-article-title">Data Is Not Software</h1>
      <p className="tm-article-titlesub">What Anthropic&rsquo;s AI Analytics Project Reveals About the Real Challenge</p>
      <p className="tm-article-subtitle">
        <em>Our read on what it takes to get AI working on real business data &mdash; and why most companies can&rsquo;t replicate it alone.</em>
      </p>
      <div className="tm-article-byline">
        <span className="tm-article-author">By Bruno Ruy&uacute;</span>
        <span className="tm-article-date">June 2026</span>
      </div>
    </header>

    <div className="tm-article-body">
      <p>This week, Anthropic published <a href="https://claude.com/blog/how-anthropic-enables-self-service-data-analytics-with-claude" target="_blank" rel="noopener">a detailed account</a> of how they built self-service data analytics internally using Claude. It&rsquo;s an unusually candid piece &mdash; and the candor is what makes it valuable. Not because it showcases what Claude can do, but because it documents what it actually took, and where the limits are.</p>
      <p>We read it carefully. Here&rsquo;s our perspective.</p>

      <h2>1. The problem is real</h2>
      <p>Anthropic didn&rsquo;t publish this piece to market their product. They published it because connecting AI to real business data turned out to be genuinely hard &mdash; hard enough that their own engineering team had to build a significant internal infrastructure project just to make it work for themselves.</p>
      <p>That&rsquo;s worth pausing on. The company that builds the most capable AI models in the world needed months of specialized engineering work to answer their own internal business questions reliably. Not because Claude isn&rsquo;t powerful. But because the problem isn&rsquo;t a model problem. It&rsquo;s a data problem.</p>
      <p>If the leading AI lab in the world needs to invest at this level to solve this for themselves, that tells you something fundamental about the nature of the challenge.</p>

      <h2>2. LLMs alone can&rsquo;t solve it &mdash; because data is not software</h2>
      <p>This is not a new insight for us. In 2021, I read the original Transformers paper and tested GPT-2. The models were impressive &mdash; but it was immediately clear that the hard problem wasn&rsquo;t the model. It was the data underneath it. That became the founding premise of Teramot, and it&rsquo;s what I&rsquo;ve said in every pitch, every talk, and every architecture decision since.</p>
      <p>In June 2026, Anthropic published it as a section title in their own blog. That&rsquo;s not a coincidence. It&rsquo;s a confirmation.</p>

      <AnthropicScreenshot lang="en" />

      <p>Code is deterministic and self-describing. You can read a function and understand what it does. Data is different. It carries business context, organizational history, ambiguity, and constant change that accumulates over years inside a company. A model &mdash; no matter how capable &mdash; cannot infer what &ldquo;revenue&rdquo; means in your specific context, which entities your team refers to as &ldquo;the Q2 launch,&rdquo; or why two departments calculate the same metric differently.</p>
      <p>Anthropic tested this assumption directly. When they tried to bootstrap their semantic layer using LLMs &mdash; having the model auto-generate metric definitions from raw tables and query logs &mdash; the output was <em>&ldquo;net-negative on our evals versus a smaller, human-curated layer.&rdquo;</em> The model produced plausible-looking definitions that encoded the very ambiguities they were trying to eliminate.</p>
      <p>You can&rsquo;t prompt your way out of a data problem.</p>

      <h2>3. Their solution required a world-class team &mdash; and they&rsquo;re still not satisfied</h2>
      <p>What Anthropic built is technically impressive. Governed canonical datasets, a human-curated semantic layer, a business context graph with indexed documents and organizational structure, colocated artifacts across layers with CI checks that protect cross-layer integrity, and a provenance footer on every response showing where the data came from and how fresh it is.</p>
      <p>That&rsquo;s exactly the right architecture. The issue is what it took to build and maintain it.</p>
      <p>It required a specialized team working over multiple months. Every incremental change to the metadata triggers evaluation runs that take an hour each and cost significant resources. Skills need to be reviewed and updated every month as business logic and data models evolve.</p>
      <p>And after all of that investment, they report 95% accuracy in production responses &mdash; and are candid that they don&rsquo;t yet have a robust solution for what they call &ldquo;silent failures&rdquo;: the cases where the answer is wrong, looks plausible, and gets used without anyone noticing. One answer in twenty reaching a senior leader undetected isn&rsquo;t a production system. It&rsquo;s a very well-built prototype.</p>

      <h2>4. Every critical layer requires humans in the loop</h2>
      <p>Perhaps the most telling detail in the piece: after all the engineering investment, human oversight remains structurally necessary at every critical layer.</p>
      <p>The semantic layer cannot be automated &mdash; as their own experiments showed, model-generated definitions are worse than smaller human-curated ones. The business context layer, which they describe as &ldquo;the layer most teams skip,&rdquo; requires continuous human curation to stay current with how the business actually works. Every response destined for leadership requires explicit human sign-off before it&rsquo;s trusted.</p>
      <p>Their conclusion is direct: generate documentation with AI, but have a human own the definition.</p>
      <p>That&rsquo;s the right answer for Anthropic. They have the team to make it work. But it raises the obvious question: what does a company do if it doesn&rsquo;t have that team?</p>
      <p>For any organization that wants to replicate what Anthropic built, the honest answer is that they need to hire and maintain a dedicated group of specialized data and AI engineers &mdash; not to build the product, but just to keep the AI data layer running. That&rsquo;s not a product strategy. That&rsquo;s a cost center. And it&rsquo;s one most companies can&rsquo;t sustain.</p>

      <h2>What this means &mdash; and how Teramot approaches it differently</h2>

      <DiagramComparison lang="en" />

      <p>The architecture Anthropic describes is not wrong in itself. The problem is the operating model it requires.</p>
      <p>The reason their approach depends on ongoing human maintenance is structural: they built an AI layer on top of existing data infrastructure, and compensated for the lack of a structured foundation with skills, reference documentation, and human curation. When the underlying data changes &mdash; which it does, constantly &mdash; the text-based knowledge layer drifts, and humans have to realign it.</p>
      <p>Teramot starts one layer below. Before anything reaches an AI agent, we deploy a full data lakehouse &mdash; Bronze, Silver, and Gold layers &mdash; where every transformation is deterministic SQL and all metadata lives in a structured relational database, not in text files. Once that foundation is in place, the AI doesn&rsquo;t infer &mdash; it queries. The result is the same every time.</p>
      <p>Does this require human iteration to build? Yes &mdash; and we think that&rsquo;s honest. Business knowledge doesn&rsquo;t emerge automatically. The difference is that with Teramot, that iteration is fast &mdash; typically under an hour to deploy a first functional version, and five minutes for each new iteration &mdash; and stable over time. You don&rsquo;t rebuild it every month. You build it once, and it holds. Because the knowledge is structured and relational, changes to the data model propagate correctly instead of silently breaking a text file somewhere downstream.</p>
      <p>After three years of R&amp;D and production deployments across companies in Latin America, we launched in February 2026 the version that makes this fully self-serve: a company can go from zero to a governed, AI-ready data lakehouse by signing up on our website and entering a credit card. No onboarding from our side. No specialized engineers on theirs.</p>
      <p>What Anthropic described is the right problem, solved the right way given their constraints. What we&rsquo;re building is the same outcome &mdash; AI that actually works on real business data &mdash; designed for the companies that don&rsquo;t have Anthropic&rsquo;s team.</p>
    </div>

    <footer className="tm-article-footer">
      <p><em>Teramot is a data lakehouse platform that deploys governed, AI-ready data infrastructure for companies. Learn more at <a href="https://teramot.com">teramot.com</a>.</em></p>
    </footer>
  </article>
);

const ArticleES = () => (
  <article className="tm-article">
    <header className="tm-article-header">
      <a href="../blog.html" className="tm-article-back">← Perspectivas</a>
      <h1 className="tm-article-title">Los Datos No Son Software</h1>
      <p className="tm-article-titlesub">Lo que el proyecto de Analytics de Anthropic revela sobre el verdadero desaf&iacute;o</p>
      <p className="tm-article-subtitle">
        <em>Nuestra lectura sobre lo que hace falta para que la IA funcione con datos reales de negocio &mdash; y por qu&eacute; la mayor&iacute;a de las empresas no puede replicarlo sola.</em>
      </p>
      <div className="tm-article-byline">
        <span className="tm-article-author">Por Bruno Ruy&uacute;</span>
        <span className="tm-article-date">Junio 2026</span>
      </div>
    </header>

    <div className="tm-article-body">
      <p>Esta semana, Anthropic public&oacute; <a href="https://claude.com/blog/how-anthropic-enables-self-service-data-analytics-with-claude" target="_blank" rel="noopener">un relato detallado</a> de c&oacute;mo construyeron analytics de datos self-service internamente usando Claude. Es una nota inusualmente honesta &mdash; y esa honestidad es lo que la hace valiosa. No porque muestre lo que Claude puede hacer, sino porque documenta lo que realmente cost&oacute; hacerlo, y d&oacute;nde est&aacute;n los l&iacute;mites.</p>
      <p>La leímos con atención. Acá nuestra perspectiva.</p>

      <h2>1. El problema es real</h2>
      <p>Anthropic no public&oacute; esta nota para hacer marketing de su producto. La public&oacute; porque conectar IA con datos reales de negocio result&oacute; ser genuinamente dif&iacute;cil &mdash; tan dif&iacute;cil que su propio equipo de ingenier&iacute;a tuvo que construir un proyecto interno de infraestructura significativo solo para que funcionara para ellos mismos.</p>
      <p>Vale la pena detenerse en eso. La empresa que construye los modelos de IA m&aacute;s capaces del mundo necesit&oacute; meses de trabajo especializado para responder sus propias preguntas de negocio de forma confiable. No porque Claude no sea poderoso. Sino porque el problema no es un problema de modelos. Es un problema de datos.</p>
      <p>Si el laboratorio de IA l&iacute;der en el mundo necesita invertir a este nivel para resolverlo por s&iacute; mismo, eso te dice algo fundamental sobre la naturaleza del desaf&iacute;o.</p>

      <h2>2. Los LLMs solos no pueden resolverlo &mdash; porque los datos no son software</h2>
      <p>Este no es un insight nuevo para nosotros. En 2021, le&iacute; el paper original de Transformers y prob&eacute; GPT-2. Los modelos eran impresionantes &mdash; pero qued&oacute; inmediatamente claro que el problema dif&iacute;cil no era el modelo. Era el dato debajo. Esa se convirti&oacute; en la premisa fundacional de Teramot, y es lo que digo en cada pitch, en cada charla y en cada decisi&oacute;n de arquitectura desde entonces.</p>
      <p>En junio de 2026, Anthropic lo public&oacute; como t&iacute;tulo de secci&oacute;n en su propio blog. No es una coincidencia. Es una confirmaci&oacute;n.</p>

      <AnthropicScreenshot lang="es" />

      <p>El c&oacute;digo es determin&iacute;stico y se autodescribe. Pod&eacute;s leer una funci&oacute;n y entender qu&eacute; hace. Los datos son diferentes. Llevan contexto de negocio, historia organizacional, ambig&uuml;edad y cambio constante que se acumula durante a&ntilde;os dentro de una empresa. Un modelo &mdash; por m&aacute;s capaz que sea &mdash; no puede inferir qu&eacute; significa &ldquo;revenue&rdquo; en tu contexto espec&iacute;fico, a qu&eacute; se refiere tu equipo cuando habla del &ldquo;lanzamiento del Q2&rdquo;, o por qu&eacute; dos &aacute;reas calculan la misma m&eacute;trica de forma diferente.</p>
      <p>Anthropic prob&oacute; esta suposici&oacute;n directamente. Cuando intentaron generar autom&aacute;ticamente su capa sem&aacute;ntica usando LLMs &mdash; haciendo que el modelo auto-generara definiciones de m&eacute;tricas a partir de tablas y logs de queries &mdash; el resultado fue <em>&ldquo;net-negative on our evals versus a smaller, human-curated layer.&rdquo;</em> El modelo produjo definiciones que parec&iacute;an correctas pero que codificaban exactamente las ambig&uuml;edades que quer&iacute;an eliminar.</p>
      <p>No se puede hacer prompting para salir de un problema de datos.</p>

      <h2>3. Su soluci&oacute;n requiri&oacute; un equipo de primer nivel &mdash; y a&uacute;n no est&aacute;n satisfechos</h2>
      <p>Lo que Anthropic construy&oacute; es t&eacute;cnicamente impresionante. Datasets can&oacute;nicos gobernados, una capa sem&aacute;ntica curada por humanos, un grafo de contexto de negocio con documentos indexados y estructura organizacional, artefactos colocados en capas con CI checks que protegen la integridad entre capas, y un footer de procedencia en cada respuesta que muestra de d&oacute;nde vienen los datos y qu&eacute; tan frescos son.</p>
      <p>Esa es exactamente la arquitectura correcta. El problema es lo que cost&oacute; construirla y mantenerla.</p>
      <p>Requiri&oacute; un equipo especializado trabajando durante varios meses. Cada cambio incremental en la metadata dispara ciclos de evaluaci&oacute;n que tardan una hora cada uno y cuestan recursos significativos. Las skills necesitan revisarse y actualizarse cada mes a medida que la l&oacute;gica de negocio y los modelos de datos evolucionan.</p>
      <p>Y despu&eacute;s de toda esa inversi&oacute;n, reportan 95% de accuracy en respuestas en producci&oacute;n &mdash; y son honestos en admitir que todav&iacute;a no tienen una soluci&oacute;n robusta para lo que llaman &ldquo;silent failures&rdquo;: los casos donde la respuesta es incorrecta, parece plausible, y se usa sin que nadie lo note. Una respuesta de cada veinte llegando a un l&iacute;der sin ser detectada no es un sistema de producci&oacute;n. Es un prototipo muy bien construido.</p>

      <h2>4. Cada capa cr&iacute;tica requiere humanos en el loop</h2>
      <p>Quiz&aacute;s el detalle m&aacute;s revelador: despu&eacute;s de toda la inversi&oacute;n en ingenier&iacute;a, la supervisi&oacute;n humana sigue siendo estructuralmente necesaria en cada capa cr&iacute;tica.</p>
      <p>La capa sem&aacute;ntica no puede automatizarse &mdash; como sus propios experimentos demostraron, las definiciones generadas por modelos son peores que una capa m&aacute;s peque&ntilde;a curada por humanos. La capa de contexto de negocio, que describen como &ldquo;the layer most teams skip,&rdquo; requiere curation humana continua para mantenerse al d&iacute;a con c&oacute;mo el negocio realmente funciona. Cada respuesta destinada al liderazgo requiere aprobaci&oacute;n humana expl&iacute;cita antes de ser utilizada.</p>
      <p>Su conclusi&oacute;n es directa: generar documentaci&oacute;n con IA, pero que un humano sea due&ntilde;o de la definici&oacute;n.</p>
      <p>Esa es la respuesta correcta para Anthropic. Ellos tienen el equipo para hacerlo funcionar. Pero plantea la pregunta obvia: &iquest;qu&eacute; hace una empresa que no tiene ese equipo?</p>
      <p>Para cualquier organizaci&oacute;n que quiera replicar lo que Anthropic construy&oacute;, la respuesta honesta es que necesita contratar y mantener un grupo dedicado de ingenieros especializados en datos e IA &mdash; no para construir el producto, sino solo para mantener la capa de datos con IA funcionando. Eso no es una estrategia de producto. Es un centro de costos. Y es uno que la mayor&iacute;a de las empresas no puede sostener.</p>

      <h2>Qu&eacute; significa esto &mdash; y c&oacute;mo Teramot lo aborda de forma diferente</h2>

      <DiagramComparison lang="es" />

      <p>La arquitectura que Anthropic describe no est&aacute; mal en s&iacute; misma. El problema es el modelo operativo que requiere.</p>
      <p>La raz&oacute;n por la que su approach depende de mantenimiento humano continuo es estructural: construyeron una capa de IA sobre infraestructura de datos existente, y compensaron la falta de una fundaci&oacute;n estructurada con skills, documentaci&oacute;n de referencia y curation humana. Cuando los datos subyacentes cambian &mdash; lo cual ocurre constantemente &mdash; la capa de conocimiento basada en texto se desalinea, y los humanos tienen que realinearla.</p>
      <p>Teramot empieza una capa m&aacute;s abajo. Antes de que nada llegue a un agente de IA, deployamos un data lakehouse completo &mdash; capas Bronze, Silver y Gold &mdash; donde cada transformaci&oacute;n es SQL determin&iacute;stico y toda la metadata vive en una base de datos relacional estructurada, no en archivos de texto. Una vez que esa fundaci&oacute;n est&aacute; en su lugar, la IA no infiere &mdash; consulta. El resultado es el mismo cada vez.</p>
      <p>&iquest;Esto requiere iteraci&oacute;n humana para construirse? S&iacute; &mdash; y creemos que eso es honesto. El conocimiento de negocio no emerge autom&aacute;ticamente. La diferencia es que con Teramot, esa iteraci&oacute;n es r&aacute;pida &mdash; t&iacute;picamente menos de una hora para deployar una primera versi&oacute;n funcional, y cinco minutos para cada nueva iteraci&oacute;n &mdash; y estable en el tiempo. No se reconstruye cada mes. Se construye una vez, y se mantiene. Porque el conocimiento es estructurado y relacional, los cambios en el modelo de datos se propagan correctamente en lugar de romper silenciosamente un archivo de texto en algún lugar aguas abajo.</p>
      <p>Despu&eacute;s de tres a&ntilde;os de R&amp;D y deployments en producci&oacute;n en empresas de Am&eacute;rica Latina, lanzamos en febrero de 2026 la versi&oacute;n que lo hace completamente self-serve: una empresa puede pasar de cero a un data lakehouse gobernado y listo para IA registr&aacute;ndose en nuestro sitio e ingresando una tarjeta de cr&eacute;dito. Sin onboarding de nuestra parte. Sin ingenieros especializados de su lado.</p>
      <p>Lo que Anthropic describi&oacute; es el problema correcto, resuelto de la manera correcta dadas sus restricciones. Lo que estamos construyendo es el mismo resultado &mdash; IA que realmente funciona con datos reales de negocio &mdash; dise&ntilde;ado para las empresas que no tienen el equipo de Anthropic.</p>
    </div>

    <footer className="tm-article-footer">
      <p><em>Teramot es una plataforma de data lakehouse que deploya infraestructura de datos gobernada y lista para IA. Conoc&eacute; m&aacute;s en <a href="https://teramot.com">teramot.com</a>.</em></p>
    </footer>
  </article>
);

const ArticlePage = () => {
  const { lang } = useLang();
  return (
    <>
      <NavBar />
      <main className="tm-article-page">
        <div className="tm-article-container">
          {lang === 'en' ? <ArticleEN /> : <ArticleES />}
        </div>
      </main>
      <Footer />
    </>
  );
};

ReactDOM.createRoot(document.getElementById('root')).render(
  <LangProvider defaultLang="en"><ArticlePage /></LangProvider>
);
