Nachgestellte Leerzeichen und String-Vergleiche in Datenbanken

Für Datenbanken die sich an den SQL-92-Standard halten, gilt für Vergleiche von character strings nach Abschnitt 8.2 Generals Rules #3, dass die zu vergleichenden Strings, vor dem Vergleich auf die selbe Länge gebracht werden müssen. Der eventuell kürzere String wird demnach nach rechts auf die Länge des zu vergleichenden Strings mit Hilfe eines pad character, meist dem Leerzeichen, aufgefüllt.

Unter character strings fallen die Typen char (character) und varchar (character varying). Diese Typen ähneln einander, werden aber auf unterschiedliche Weise gespeichert und abgerufen.
char-Werte werden beim Speichern nach rechts mit Leerzeichen bis auf die deklarierte Länge aufgefüllt, welche beim Abrufen aber wieder entfernt werden. Bei char-Werten mit einer maximalen Anzahl von vier Zeichen beispielweise, kann man deshalb nicht zwischen 'abc' und 'abc ' unterscheiden.
Im Gegensatz dazu werden varchar-Werte nur mit so vielen Zeichen wie erforderlich zuzüglich der Information über die Länge gespeichert. varchar-Werte werden beim Speichern nicht aufgefüllt. Somit werden auch Leerzeichen beim Speichern und Abrufen beibehalten.

Und jetzt? Jetzt wollen wir versuchen aus den varchar-Werten 'abc' und 'abc ' nur 'abc ' zu selektieren.

Als Erstes brauchen wir natürlich eine Datenbank mit den gewünschten Daten (hier in MySQL):

CREATE DATABASE playground;
USE playground;
CREATE TABLE pad (string varchar(5));
INSERT INTO pad VALUES('abc');
INSERT INTO pad VALUES('abc ');
INSERT INTO pad VALUES('abc  ');

Als Nächstes überprüfen wir, ob – wie im Standard definiert – bei varchar-Werten Leerzeichen beim Speichern und Abrufen beibehalten werden:

SET sql_mode = PIPES_AS_CONCAT;
 
SELECT '"' || string || '"', LENGTH(string) FROM pad;
 
+----------------------+----------------+
| '"' || string || '"' | LENGTH(string) |
+----------------------+----------------+
| "abc"                |              3 |
| "abc "               |              4 |
| "abc  "              |              5 |
+----------------------+----------------+

Das sieht doch gut aus. Nun zurück zur eigentlichen Aufgabe: Wir wollen aus diesen Daten nur 'abc ' selektieren:

SELECT '"' || string || '"', LENGTH(string) FROM pad WHERE string = 'abc ';
 
+----------------------+----------------+
| '"' || string || '"' | LENGTH(string) |
+----------------------+----------------+
| "abc"                |              3 |
| "abc "               |              4 |
| "abc  "              |              5 |
+----------------------+----------------+

Irgendwie nicht richtig. Oder doch? Wie eingangs erwähnt, tritt hier die Regel für Vergleiche von character strings aus dem SQL-92-Standard in Kraft: Der kürzere zu vergleichende String wird nach rechts mit Leerzeichen aufgefüllt. Wenn 'abc' mit 'abc ' verglichen wird, wird eigentlich 'abc ' mit 'abc ' verglichen, oder 'abc' mit 'abc' – wer weiß das schon so genau :).

Kommt man trotzdem auf das gewünschte Ergebnis? Klar, mit einem Zaubertrick:

SELECT '"' || string || '"', LENGTH(string) FROM pad WHERE BINARY string = 'abc ';
 
+----------------------+----------------+
| '"' || string || '"' | LENGTH(string) |
+----------------------+----------------+
| "abc "               |              4 |
+----------------------+----------------+

Gibt’s Ausnahmen? Ja! Bei PostgreSQL sind bei Vergleichen von varchar-Werten nachgestellte Leerzeichen signifikant.

Eric Lippmann

Autor: Eric Lippmann

Eric kam während seines ersten Lehrjahres zu NETWAYS und hat seine Ausbildung bereits 2011 sehr erfolgreich abgeschlossen. Seit Beginn arbeitet er in der Softwareentwicklung und dort an den unterschiedlichen NETWAYS Open Source Lösungen, insbesondere inGraph und im Icinga Team an Icinga Web. Darüber hinaus zeichnet er sich für viele Kundenentwicklungen in der Finanz- und Automobilbranche verantwortlich.

PHP SPL: Peek Ahead During Iteration

This entry is part 1 of 6 in the series PHP SPL Examples

Eines der “Glanzstücke” von PHP und definitiv eine Blog-Serie wert, ist die seit Version 5.0.0 verfügbare SPL.

Was ist das?
SPL ist die Standard PHP Library, die laut dem PHP-Handbuch eine Sammlung von Interfacen und Klassen für die Lösung von Standardproblemen ist. Wer Klassen und Interfaces aus der SPL verwendet, die quasi eine API zu den intern eingebauten PHP Funktionen sind, kann mit Standardmitteln voll objektorientierten Code schreiben.

Nachfolgend das erste Beispiel dieser Serie.

Peek ahead during iteration

<?php
 
$arrayIterator = new ArrayIterator(range(0, 10));
$cachingIterator = new CachingIterator($arrayIterator, CachingIterator::TOSTRING_USE_CURRENT);
 
foreach ($cachingIterator as $value) {
    echo 'Current value is: ' . $value . PHP_EOL;
    echo 'Next value is: ' . ($cachingIterator->getInnerIterator()->valid() ?
        $cachingIterator->getInnerIterator()->current() : 'eoi') . PHP_EOL;
}
Eric Lippmann

Autor: Eric Lippmann

Eric kam während seines ersten Lehrjahres zu NETWAYS und hat seine Ausbildung bereits 2011 sehr erfolgreich abgeschlossen. Seit Beginn arbeitet er in der Softwareentwicklung und dort an den unterschiedlichen NETWAYS Open Source Lösungen, insbesondere inGraph und im Icinga Team an Icinga Web. Darüber hinaus zeichnet er sich für viele Kundenentwicklungen in der Finanz- und Automobilbranche verantwortlich.

Graphite auf CentOS, RHEL oder Fedora installieren

Um Graphite auf einem CentOS, RHEL oder Fedora zu installieren, muss das EPEL Repository eingebunden werden. Danach können die zu Graphite gehörenden Pakete installiert werden:

yum install python-whisper python-carbon graphite-web

Graphite-web benötigt noch eine Datenbank um Session- und Benutzerinformationen zu speichern, zum Beispiel MySQL:

# mysql -u root -p
 
mysql> CREATE DATABASE graphite;
mysql> GRANT ALL ON graphite.* TO graphite@localhost IDENTIFIED BY 'graphite';

Damit die erstellte Datenbank von Graphite-web genutzt wird, muss in der Datei /etc/graphite-web/local_settings.py folgende Konfiguration hinzugefügt werden:

DATABASES = {
  'default': {
    'NAME': 'graphite',
    'ENGINE': 'django.db.backends.mysql',
    'USER': 'graphite',
    'PASSWORD': 'graphite',
    'HOST': 'localhost',
    'PORT': '3306',
  }
}

Der Datenbank fehlt jetzt nur noch das Schema und ein administrativer Benutzer, die mit folgendem Kommando angelegt werden:

# /usr/lib/python2.6/site-packages/graphite/manage.py syncdb

Zum Abschluss muss in der Datei /usr/lib/python2.6/site-packages/graphite/settings.py nur noch der SECRET_KEY konfiguriert werden.

Eric Lippmann

Autor: Eric Lippmann

Eric kam während seines ersten Lehrjahres zu NETWAYS und hat seine Ausbildung bereits 2011 sehr erfolgreich abgeschlossen. Seit Beginn arbeitet er in der Softwareentwicklung und dort an den unterschiedlichen NETWAYS Open Source Lösungen, insbesondere inGraph und im Icinga Team an Icinga Web. Darüber hinaus zeichnet er sich für viele Kundenentwicklungen in der Finanz- und Automobilbranche verantwortlich.

git-archive – Dateien ignorieren

Über die Datei .gitattributes können in einem Git Repository Attribute auf Dateien und Pfaden gesetzt werden, die bestimmte Git Befehle beeinflussen. Wer git-archive nutzt, um Archive aus seinem Repository zu erstellen, kann über .gitattributes bestimmte Dateien aus Archiven ausschließen:

echo "example/* export-ignore" >>.gitattributes
git add .gitattributes
git commit -m "Do not export example data"

Das Attribut export-ignore bewirkt, dass alle Dateien die auf das Muster example/* passen, aus Archiven ausgeschlossen werden. export-ignore wirkt erst dann, wenn die Änderungen an .gitattributes commited wurden.

Den aktuellen Stand des Repository stellt man mit folgendem Befehl als Archiv bereit:

git archive -o latest.tgz HEAD

Andere Attribute passen zum Beispiel die Zeilenenden in Textdateien automatisch an, oder ersetzen $Id$ mit der commit id nach dem Check-in.

Zum Weiterlesen:

Eric Lippmann

Autor: Eric Lippmann

Eric kam während seines ersten Lehrjahres zu NETWAYS und hat seine Ausbildung bereits 2011 sehr erfolgreich abgeschlossen. Seit Beginn arbeitet er in der Softwareentwicklung und dort an den unterschiedlichen NETWAYS Open Source Lösungen, insbesondere inGraph und im Icinga Team an Icinga Web. Darüber hinaus zeichnet er sich für viele Kundenentwicklungen in der Finanz- und Automobilbranche verantwortlich.

schema.org – “Hey Google, das ist ein Video!”

Strukturierte Daten helfen Suchmaschinen dabei, die Informationen auf Webseiten besser zu verstehen und somit besser auszugeben. Einfach gesagt, werden Inhalte mit einem speziellen Markup-Format ausgezeichnet, um Suchmaschinen, Elementtyp und Eigenschaften verfügbar zu machen. Google zum Beispiel generiert aus dem Seiten-Markup Rich Snippets, die im Rahmen der Suchergebnisse angezeigt werden. Ein Snippet für eine Webseite mit Veranstaltungsdaten und entsprechendem Markup kann zum Beispiel so aussehen:
Rich Snippet für eine Seite mit Veranstaltungen

schema.org ist ein gemeinsames Projekt von Google, Microsoft und Yahoo! zur Schaffung eines Markup-Schemas für strukturierte Daten, das von allen gängigen Suchmaschinen unterstützt wird. Ein gemeinsames Markup-Vokabular erleichtert Webmastern, sich für ein Markup-Schema zu entscheiden, denn es müssen keine Kompromisse mehr eingegangen werden, weil bestimmte Markup-Typen nur von bestimmten Suchmaschinen unterstützt werden.

Wer seine Webseite mithilfe eines Schemas auszeichnet, verbessert die Qualität von Suchergebnissen und so die Sucherfahrung der Nutzer. Auf das Ranking aber, hat die Verwendung von Markup keinen Einfluss. Weitere Fragen beantwortet Google auf einer FAQ Seite.

Eric Lippmann

Autor: Eric Lippmann

Eric kam während seines ersten Lehrjahres zu NETWAYS und hat seine Ausbildung bereits 2011 sehr erfolgreich abgeschlossen. Seit Beginn arbeitet er in der Softwareentwicklung und dort an den unterschiedlichen NETWAYS Open Source Lösungen, insbesondere inGraph und im Icinga Team an Icinga Web. Darüber hinaus zeichnet er sich für viele Kundenentwicklungen in der Finanz- und Automobilbranche verantwortlich.