¿cómo se realiza la particion?

¿cómo se realiza la particion?

¿cómo se realiza la particion?

Partición hash

Los almacenes de datos suelen contener tablas de gran tamaño y requieren técnicas tanto para la gestión de estas tablas de gran tamaño como para proporcionar un buen rendimiento de las consultas en estas tablas de gran tamaño. En este capítulo se analiza el particionamiento, una metodología clave para satisfacer estas necesidades.

En esta sección se describen las características del particionamiento que mejoran significativamente el acceso a los datos y el rendimiento general de las aplicaciones. Esto es especialmente cierto para las aplicaciones que acceden a tablas e índices con millones de filas y muchos gigabytes de datos.

Las tablas e índices particionados facilitan las operaciones administrativas al permitir que estas operaciones funcionen en subconjuntos de datos. Por ejemplo, puede añadir una nueva partición, organizar una partición existente o eliminar una partición con una interrupción mínima o nula de una aplicación de sólo lectura.

El uso de los métodos de partición descritos en esta sección puede ayudarle a ajustar las sentencias SQL para evitar escaneos innecesarios de índices y tablas (utilizando la poda de particiones). También puede mejorar el rendimiento de las operaciones de unión masiva cuando se unen grandes cantidades de datos (por ejemplo, varios millones de filas) mediante el uso de uniones con particiones. Por último, la partición de datos mejora en gran medida la capacidad de gestión de las bases de datos de gran tamaño y reduce drásticamente el tiempo necesario para las tareas administrativas, como las copias de seguridad y la restauración.

Particionamiento de oracle

El particionamiento se realiza para mejorar el rendimiento y facilitar la gestión de los datos. El particionamiento también ayuda a equilibrar los distintos requisitos del sistema. Optimiza el rendimiento del hardware y simplifica la gestión del almacén de datos al dividir cada tabla de hechos en múltiples particiones separadas. En este capítulo, discutiremos diferentes estrategias de particionamiento.

Si no particionamos la tabla de hechos, tendremos que cargar la tabla de hechos completa con todos los datos. El particionamiento nos permite cargar sólo la cantidad de datos que se requiere regularmente. Reduce el tiempo de carga y también mejora el rendimiento del sistema.

Nota – Para reducir el tamaño de la copia de seguridad, todas las particiones que no sean la actual pueden marcarse como de sólo lectura. Entonces podemos poner estas particiones en un estado en el que no puedan ser modificadas. Entonces se puede hacer una copia de seguridad de ellas. Esto significa que sólo la partición actual debe ser respaldada.

Al dividir la tabla de hechos en conjuntos de datos, se pueden mejorar los procedimientos de consulta. El rendimiento de la consulta se mejora porque ahora la consulta explora sólo las particiones que son relevantes. No tiene que escanear todos los datos.

Partición por turnos

En muchas soluciones a gran escala, los datos se dividen en particiones que se pueden gestionar y a las que se puede acceder por separado. El particionamiento puede mejorar la escalabilidad, reducir la contención y optimizar el rendimiento. También puede proporcionar un mecanismo para dividir los datos por patrón de uso. Por ejemplo, puede archivar los datos más antiguos en un almacenamiento de datos más barato.

Estas estrategias pueden combinarse, y le recomendamos que las tenga en cuenta todas cuando diseñe un esquema de partición. Por ejemplo, puede dividir los datos en fragmentos y luego utilizar el particionamiento vertical para subdividir aún más los datos en cada fragmento.

La Figura 1 muestra la partición horizontal o sharding. En este ejemplo, los datos del inventario de productos se dividen en fragmentos basados en la clave del producto. Cada fragmento contiene los datos de un rango contiguo de claves de fragmentos (A-G y H-Z), organizados alfabéticamente. La fragmentación reparte la carga entre más ordenadores, lo que reduce la contención y mejora el rendimiento.

El factor más importante es la elección de la clave de fragmentación. Puede ser difícil cambiar la clave después de que el sistema esté en funcionamiento. La clave debe garantizar la partición de los datos para repartir la carga de trabajo de la manera más uniforme posible entre los fragmentos.

Base de datos de particiones

La partición se realiza para mejorar el rendimiento y facilitar la gestión de los datos. El particionamiento también ayuda a equilibrar los distintos requisitos del sistema. Optimiza el rendimiento del hardware y simplifica la gestión del almacén de datos al dividir cada tabla de hechos en múltiples particiones separadas. En este capítulo, discutiremos diferentes estrategias de particionamiento.

Si no particionamos la tabla de hechos, tendremos que cargar la tabla de hechos completa con todos los datos. El particionamiento nos permite cargar sólo la cantidad de datos que se requiere regularmente. Reduce el tiempo de carga y también mejora el rendimiento del sistema.

Nota – Para reducir el tamaño de la copia de seguridad, todas las particiones que no sean la actual pueden marcarse como de sólo lectura. Entonces podemos poner estas particiones en un estado en el que no puedan ser modificadas. Entonces se puede hacer una copia de seguridad de ellas. Esto significa que sólo la partición actual debe ser respaldada.

Al dividir la tabla de hechos en conjuntos de datos, se pueden mejorar los procedimientos de consulta. El rendimiento de la consulta se mejora porque ahora la consulta explora sólo las particiones que son relevantes. No tiene que escanear todos los datos.

Acerca del autor

Josue Llorente

Soy Josue Llorente, tengo 25 años y soy licenciado en Periodismo por la Universidad Complutense de Madrid con experiencia en medios tradicionales y digitales. Me apasiona el periodismo en esta nueva era y su evolución en el medio digital.

Ver todos los artículos