Google Guava (aka Google Collections Library)

Während die Java-Bibliothek mit Listen, Mengen, Assoziativspeichern einen guten Grundstock für die alltäglichen Aufgaben zur Datenverwaltung bietet, so gibt es dennoch Bedarf an weiteren Speicherstrukturen. Anstatt sie selbst zu definieren, ist es sinnvoll, in die Open-Source-Welt zu schauen. Besondern hervorzuheben ist Google Guava (http://code.google.com/p/guava-libraries/), welches eine Open-Source Bibliothek mit neuen Datenstrukturen, Utility-Methoden für die existierenden java.util-Datenstrukturen, sowie einigen anderen Utility-Klassen etwa für String-Behandlung oder zum Zerlegen von Zeichenketten ist. (Die Datenstrukturen von Guava stammen aus dem Projekt Google Collections Library, aber die Entwicklung geht bei Guava weiter.)

Für die folgenden Beispiele muss von der Webseite die Distribution guava-r06.zip heruntergeladen und das im Zip enthaltende Java-Archiv guava-r06.jar im Klassenpfad eingebunden werden.

1.1.1 Beispiel Multi-Set und Multi-Map

Da Java schon alles Grundlegende mitbringt stellt sich die Frage, was denn überhaupt fehlt. Dazu zwei Szenarios:

· Eine Textdatei soll analysiert werden. Am Ende soll feststehen, wie oft jedes Wort (unabhängig der Groß-/Kleinschreibung) in der Datei steht. Enthält die Datei etwa „In Ulm, um Ulm, um Ulm herum.“, so sollte herauskommen: „in“: 1, „ulm“: 3, „um“: 2, „herum“: 1. Im Grunde müsste es eine Menge geben, die Elemente mehrmals enthalten kann, eine sogenannte Multi-Menge (auch Multi-Set genannt). Eine Anfrage an die Multi-Menge gibt dann nicht nur ein Wahrheitswert für „enthält“ oder „enthält nicht“ zurück, sondern auch, wie oft ein Element in der Multi-Menge enthalten ist. Die Datenstruktur ist nicht Teil von Java, kann aber mit Standardmitteln für unseren Anwendungsfall mit einer Map<String, Integer> realisiert werden.

· Beispiel 2: Wieder soll eine Textdatei analysiert werden. Gespeichert werden soll für jedes Wort auch die Position, sodass sich später feststellen lässt, ob gewisse Wörter nicht vielleicht zu nah beieinander stehen, was schlechter Stil wäre. Bei der Zeichenfolge „In Ulm, um Ulm“ wäre das: „in“: 0, „ulm“: 3, 11, „um“: 8. Kämen nicht mehrere Positionen für das gleiche Wort in Frage – wie Um was ab Position 3 und 11 beginnt –, wäre eine Map perfekt. Nur gibt es in unserem Anwendungsfall zu einem Schlüssel gleich mehrere Werte. Gesucht ist eine so genannte Multi-Map. Die Java-Bibliothek enthält bisher keine Multi-Map, da damals die Sun-Entwickler argumentieren, eine solche Datenstruktur wird selten benötigt.[1] Für unseren Fall kann sie mit Map<String, List<Integer>> aber nachgebildet werden.

1.1.2 Datenstrukturen aus Guava

Guava bietet Entwicklern Klassen für Multi-Set, Mutli-Map und mehr. Dabei ist das Design vorbildlich und fügt sich perfekt in die Java-Standarddatenstrukturen ein. Das aus zwei Gründen:

· Schnittstellen deklarieren Operationen, die konkrete Klassen implementieren. So wie List eine Schnittstelle ist, die ArrayList implementiert, so wird Mulitmap etwa durch ArrayListMultimap implementiert.

· Die Datenstrukturen nutzen sehr präzise die Möglichkeiten von Java Generics. So wie Map<K,V> aus java.util, ist es die Multimap<K,V> aus Guava.

Schauen wir uns ein paar Schnittstellen und Implementierungen aus dem Paket com.google.common.collect an – die API-Dokumentation gibt es online unter http://guava-libraries.googlecode.com/svn/trunk/javadoc/index.html. (Die Schnittstelle sind jeweils mit ihren generischen Typvariablen genannt, die Implementierungen zur Abkürzung nicht.)

Schnittstelle

Aufgabe

Implementierungen

BiMap<K,V>

Eine Map-Unterschnittstelle für bidirektionale Abbildungen, um nicht nur von Schlüssel auf Wert, sondern auch von Wert auf Schlüssel zu kommen

HashBiMap, EnumBiMap, EnumHashBiMap, ImmutableBiMap

Multimap<K,V>

Erlaubt für einen Schlüssel eine Sammlung von assoziierten Werten

ArrayListMultimap, HashMultimap, LinkedHashMultimap, LinkedListMultimap, TreeMultimap, ImmutableListMultimap, ImmutableMultimap, ImmutableSetMultimap, ForwardingListMultimap, ForwardingMultimap, ForwardingSetMultimap, ForwardingSortedSetMultimap

Multiset<E>

Eine besondere Collection, die als Menge auch mehrere gleiche Elemente erlaubt

HashMultiset, LinkedHashMultiset, TreeMultiset, ConcurrentHashMultiset, EnumMultiset, ImmutableMultiset, ForwardingMultiset

SetMultimap<K,V>

Besondere Multimap<K,V>, die die zum Schlüssel gehörenden Werte in eine Menge speichert

HashMultimap, LinkedHashMultimap, TreeMultimap, ImmutableSetMultimap, ForwardingSetMultimap, ForwardingSortedSetMultimap

SortedSetMultimap<K,V>

Eine besondere SetMultimap, die die zum Schlüssel gehörende Menge sortiert hält

TreeMultimap, ForwardingSortedSetMultimap

ListMultimap<K,V>

Besondere Multimap<K,V>, die zu einem Schlüssel gehörenden Werte in einer Liste speichert um die Reihenfolge beim Einfügen festzuhalten

ArrayListMultimap, LinkedListMultimap, ImmutableListMultimap, ForwardingListMultimap,

Bei den Klassen springen zwei Dinge ins Auge: Klassen, die mit Immutable und mit Forwarding beginnen.

· Immutable-Datenstrukturen kennen wir schon – das sind Datenstrukturen, die nur-lese-Zugriff erlauben, die aber nicht modifiziert werden können. Die Utility-Klasse Collections bietet uns ein Paar unmodifiableXXX()-Methoden, die einen nur-lese-Wrapper um die Basis-Typen Collection, List, Set, Map, SortedSet, SortedMap legen. Die ImmutableXXX-Klassen aus Guava sind die nicht veränderbaren Google-Datenstrukturen.

· Die abstrakten ForwardingXXX-Klassen arbeiten nach dem Dekorator-Pattern und leiten alle Operationen an eine andere Datenstruktur weiter. Es sind sehr spezielle Klassen und Guava nutzt sie intern – für Entwickler sind sie weniger relevant.

Im Grunde bleiben dann nur noch ein paar Datenstrukturen übrig, und das Implementierungsmuster ist wie bei den Java-Standardbibliotheken: Einige Datenstrukturen speichern die tatsächlichen Daten in Array-Listen, anderen in Hashing-Datenstrukturen, anderen wiederum in Mengen, die über Binärbäume sortiert sind.

Realisierung

Klassen

Hashing

HashBiMap, HashMultimap, LinkedHashMultimap, HashMultiset, LinkedHashMultiset

Array-List

ArrayListMultimap

Linked-List

LinkedListMultimap

Binärbaum

TreeMultimap, TreeMultimap, TreeMultiset

Die Klassen ConcurrentHashMultiset (eine sichere nebenläufige Muliset-Implementierung) und EnumBiMap, EnumHashBiMap (Typen sind eingeschränkt auf Enums) sind Sonderfälle.

1.1.3 Utility-Klassen von Guava

Auf der einen Seite bietet Guava neue Datenstrukturen, auf der anderen Seite Utility-Klassen, die eine Ergänzung zu der einen Standardklasse Collections ist.

Utility-Klasse

Aufgabe

Beispielmethoden

Collections2

Filtert und transformiert Collections

filter(), transform()

Lists

Erzeugt List-Exemplare, teilt oder transformiert sie

asList(), newArrayList(), newLinkedList(), partition(), transform()

Maps

Erzeugt neue Maps, filtert, transformiert sie

newHashMap(), fromProperties(), difference(), transformValues()

Sets

Erzeugt neue Mengen und bietet mengenorientierte Funktionen

newTreeSet(), newHashSet(), cartesianProduct(), complementOf(), difference(), union(), powerSet()

Iterators, Iterables

Operiert auf Iterator/Iterables, fügt etwa Iterator/Iterables zusammen oder setzt ihre Elemente in ein Feld

addAll(), concat(), filter(), get(), limit(), reverse(), toString()

Weiterhin gibt es für die neuen Guava-Klassen die zwei Utility-Klassen Multimaps und Multisets.

1.1.4 Prädikate

Ein Prädikat ist ein Objekt, welches auf einem Argument eine Bedingung prüft und wahr oder falsch liefert. Guava gibt eine Prädikat-Schnittstelle Predicate<T> mit der Operation boolean apply(T input) vor. Ein Prädikat könnte etwa testen, ob eine Objektreferenz null ist, oder ein String eine Mindestlänge besitzt. Prädikate verändern die Argumente nie und dürfen sie nicht „zurechtbiegen“.

Mit eigenen Predicate-Objekten lässt sich auf diverse Methoden zurückgreifen, die Sammlungen filtern. Ein paar Beispielmethoden:

§ static <E> Collection<E> Collections2.filter( Collection<E> unfiltered, Predicate<? super E> predicate )
Liefert in der Rückgabe eine Collection, die alle Elemente von unfiltered enthält, die das Prädikat erfüllen.

§ static <E> Set<E> Sets.filter( Set<E> unfiltered, Predicate<? super E> predicate )
Liefert als Rückgabe eine Menge, bei der jedes Element das Prädikat erfüllt.

§ static <T> boolean Iterables.all( Iterable<T> iterable, Predicate<? super T> predicate )
Prüft, ob alle Elemente vom Iterable (eine List ist zum Beispiel Iterable, aber auch Set) das Prädikat erfüllen.

Zum Verknüpfen von Prädikaten bietet die Predicates-Klasse statische Kombinationsmethoden wie and(), compose(), or().

1.1.5 Transformationen

Oftmals müssen die Elemente in Datenstrukturen von einem Format in ein anderes gebracht werden. Zum Beispiel sollen bei String in einer Liste die Leerzeichen vorne und hinten abgeschnitten werden oder Farben sollen in Graustufen übersetzt werden.

Für Transformationen deklariert Guava die Schnittstelle Function<F,T> mit einer Operation T apply(F from). In den Guava-Utility-Klassen gibt es jeweils transform()-Methoden, die alle Elemente einer Datenstruktur durch eine Function leiten und auf der anderen Seite das Ergebnis in eine Datenstruktur setzen und diese zurückgeben. Ein paar Beispiele:

§ static <F,T> Collection<T> Collections2.transform( Collection<F> fromCollection, Function<? super F,T> function )

§ static <F,T> Iterable<T> Iterables.transform( Iterable<F> fromIterable, Function<? super F,? extends T> function )

§ static <F,T> Iterator<T> Iterators.transform( Iterator<F> fromIterator, Function<? super F,? extends T> function )

§ static <F,T> List<T> Lists.transform( List<F> fromList, Function<? super F,? extends T> function )

§ static <K,V1,V2> Map<K,V2> Maps.transformValues( Map<K,V1> fromMap, Function<? super V1,V2> function )

§ static <E> Collection<E> Collections2.filter( Collection<E> unfiltered, Predicate<? super E> predicate )


[1] http://java.sun.com/docs/books/tutorial/collections/interfaces/map.html

Kommentieren

Willkommen

Name: Christian Ullenboom
Standort: Sonsbeck, NRW, Germany

Ich bin Christian Ullenboom und Autor des Buches ›Java ist auch eine Insel‹. In diesem Blog schreibe ich über aktuelle Java-Entwicklungen, Neuerungen in der Insel, Updates bei Java Open-Source-Bibliotheken, Best-Practices, Fortschritte bei den IDEs und neue Eclipse-Plugins. Seit 1997 schule ich als Java-Tutor Java-Themen und Sun ernannte mich 2005 zum ›Java-Champion‹.

Kategorien
Archiv
Vintage Computer Museum
Unser Museum (http://tutego.de/computeroldies/) freut sich auf neue alte HEIMCOMPUTER und SPIELKONSOLEN. Gerne nehmen wir historische Heimcomputer, Software, Literatur, Werbung und weitere Artefakte aus der Vergangenheit entgegen (als Spende oder gegen Bezahlung). Bei uns sind die Sammlerstücke in guten Händen.
Mir auf Google+ folgen

In 0 people's circles

Add to circlesi
Rss Feed Tweeter button Facebook button Technorati button Reddit button Myspace button Linkedin button Delicious button Digg button