Index-Partitionierung im verteilten Datenbanksystem ADAMpro (Bachelor Thesis, Finished)

Author

Silvan Heller

Description

Das verteilte Datenbank-System ADAMpro, das speziell für die Daten- und Metadaten­verwaltung zur Ähnlichkeitssuche in Multimedia-Kollektionen entwickelt wurde, implementiert unterschiedliche Index-Strukturen, die alle zum Ziel haben die Suchzeit einer k-nächste Nachbarn-Anfrage zu minimieren. Dazu speichern die Indexe neben der Tuple ID auch einen Such-Wert, der beispielsweise ein Hash (im Fall von Locality Sensitive-Hashing, Spectral Hashing) oder eine ID (eine Tuple ID bei extended Cluster Pruning, ein Array von Cluster IDs bei Product Quantization, ein Array von Cell IDs bei VA-File) sein kann. Diese Indexe werden im Momentpro manuell neu partitioniert werden. Das Ziel der vorliegenden Arbeit ist es, die Partitionierung von Index-Strukturen in ADAMpro genauer zu untersuchen und ein Partitionierungsschema vorzuschlagen, um die Anfrage-Zeit weiter zu verringern. Dies bietet sich insbesondere bei denjenigen Index-Strukturen an, die versuchen in den abgespeicherten Such-Werten eine Distanzinformation mitzugeben. Die Arbeit kann weiterführend untersuchen – von einer statischen Partitionierung ausgehend – ob die Partitionen dynamisch, d.h. ent­sprechend den aktuell an das System gesendeten Anfragen, angepasst werden können. Die Arbeit wird die implementierten Algorithmen in einer verteilten Evaluation unter­suchen. Für die Durchführung der Evaluation soll Chronos, wenn möglich, verwendet werden.

Start / End Dates

2016/06/01 - 2016/09/30

Supervisors

Research Topics