Las aplicaciones informáticas de los años sesenta acostumbraban a darse totalmente por lotes (batch) y estaban pensadas para una tarea muy específica relacionada con muy pocas entidades tipo.

Cada aplicación (una o varias cadenas de programas) utilizaba ficheros de movimientos para actualizar (creando una copia nueva) y/o para consultar uno o dos ficheros maestros, o excepcionalmente más de dos. Cada programa trataba como máximo un fichero maestro, que solía estar sobre cinta magnética, y en consecuencia, se trabajaba con acceso secuencial.

Cada vez que se le quería añadir una aplicación que requería el uso de algunos de los datos que ya existían, y de otros nuevos, se diseñaba un fichero nuevo con todos los datos necesarios (algo que provocaba redundancia) para evitar que los programas tuviesen que leer muchos ficheros.

A medida que se fueron introduciendo las líneas de comunicación, los terminales y los discos, se fueron escribiendo programas que permitían a varios usuarios consultar los mismos ficheros online de forma simultánea. Más adelante fue surgiendo la necesidad de hacer las actualizaciones también online.

A medida que se integraban las aplicaciones, se tuvieron que interrelacionar sus ficheros, y fue necesario eliminar la redundancia. El nuevo conjunto de ficheros se debía diseñar de modo que estuviesen interrelacionados. Al mismo tiempo, las informaciones redundantes (como por ejm, nombre, dirección de los clientes, o el nombre y el precio de los productos), que figuraban en los ficheros de más de una de las aplicaciones, debía estar ahora en un sólo lugar.

El acceso online y la utilización eficiente de las interrelaciones exigían estructuras físicas que diesen un aspecto rápido, como por ejm los índices, las multilistas, las técnicas de hashing

Estos conjuntos de ficheros interrelacionados, con estructuras complejas y compartidos por varios procesos de forma simultánea (unos on-line y otros por lotes), recibieron al principio el nombre de Data Banks, y después, a inicios de los años setenta, el de Data Bases. Aquí los denominamos bases de datos (BD).

El software de gestión de ficheros era demasiado elemental para dar satisfacción a todas estas necesidades. Por ejemplo, el tratamiento de las interrelaciones no estaba previsto, no era posible que varios usuarios actualizaran datos simultáneamente… La utilización de estos conjuntos de ficheros por parte de los programas de aplicación era excesivamente compleja, de modo que, especialmente durante la segunda mitad de los años setenta, fue saliendo al mercado software más sofisticado: los Data Base Management Systems, que aquí  denominamos sistemas de gestión de BD (SGBD).

Una base de datos de un SI es la representación integrada de los conjuntos de entidades instancia correspondientes a las diferentes entidades tipo del SI y de sus interrelaciones. Esta representación informática (o conjunto estructurado de datos) debe poder ser utilizada de forma compartida por muchos usuarios de distintos tipos.

En otras palabras, una base de datos es un conjunto estructurado de datos que representa entidades y sus interrelaciones. La representación será única e integrada, a pesar de que debe permitir utilizaciones varias y simultáneas.