Vergleichstest: 3 OCR Engines unter Linux

Neulich kam meine Frau mit der Bitte, ein als PDF empfangenes Fax in Text umzuwandeln. Denn im PDF-Betrachter konnte man nur Graphik ausschneiden, aber keinen Text. Also Zeit für mich, mich mal ein wenig mehr mit den OCR (Optical Code Recognition) Programmen unter Linux zu beschäftigen.

Weiterlesen

Links für 2011-10-25

Obwohl ich gerade ein wenig mehr als sonst zu tun habe sammeln sich doch einige Links aus meinen RSS-Feeds an, also Zeit mal wieder für ein paar lesenswerte Stellen im Web:

  • Die Messe der Spekulanten findet in Zürich statt“ – Freeman vom ASR-Blog über eine Fachmesse für Zocker die für ihr Casino keine Lizenz brauchen und auch keine Abgaben an den Staat zahlen müsen.
  • Manifest echte Demokratie jetzt“ – Andy hat auf Kinderalarm die deutsche Übersetzung des spanischen Manifests eingestellt. Lesebefehl!
  • Die ständige Mär vom deutschen Konsumboom“ – Die Propagandamschine läuft und erzählt uns in den Nachrichten, dass „der Deutsche“ in Konsumlaune sei. Steffen beweist in seinem Querschuss, dass diese Behauptung eher in die Kategorie „So lügt man mit Statistik“ fällt.
  • Rammstein ist für alle da“ – Udo Vetter berichtet, dass das Album „Liebe ist für alle da“ von Rammstein nun nicht mehr auf dem Index für jugendgefährdende Schriften steht. Das VG Köln hat einen entsprechenden Eilbescheid aus dem letzten Jahr bestätigt.

Bildung auf Chipkarte oder Gutschein

Vor einiger Zeit habe ich ja schon mal eine Umfrage gestartet die auch ein paar Antworten bekommen hat. Nun ist es an der Zeit, sich mal ein wenig tiefer mit den neuen Ideen der Frau von der Leyen auseinanderzusetzen.

Das angebliche Ziel ist, Kindern aus finanzschwachen Familien den Zugang zu Bildungsangeboten wie Musikunterricht oder Sportvereinen zu gewähren. Eine Stigmatisierung der Kinder soll nicht stattfinden, was schwer vorstellbar ist, wenn nur die Kinder aus finanzschwachen Familien diese Chipkarten oder Gutscheine erhalten. Zahlungen an die Eltern werden explizit mit dem Argument ausgeschlossen, dass die Eltern das Geld ja dann doch für andere Dinge (z.B. Alkohol und Zigaretten) nutzen würden. Also genau so wie man sich dank „scripted reality“ ein Hartz-IV-Familie vorzustellen hat.

Fangen wir mal auf der einfachen Seite an: Gutscheine oder Chipkarten sind aktuell keine anerkannten Zahlungsmittel. Die Musiklehrer oder Sportvereine müssen also irgendwie an ihr Geld kommen, im Falle von Gutscheinen also eine Abrechnung mit einem Dienstleister, im Falle von Chipkarten kommt zur Abrechnung auch noch die dazu notwendige Infrastruktur hinzu um die Chipkarte überhaupt lesen zu können. Als Vorstand eines Sportvereins wage ich hier starke Zweifel anzumelden, dass sich irgendwer tatsächlich die dafür notwendigen Gerätschaften anschafft oder gewillt ist, bei der Beitragsabrechnung den Sonderfall „Gutschein“ zu berücksichtigen. In meinem Verein könnte ich mir eher vorstellen, Kinder und Jugendliche einfach beitragsfrei zu stellen statt hier einen teuren Rummel zu veranstalten.

Anders wohl die Musiklehrer. Die Klavierlehrerin meiner Tochter kostet 60 Euro im Monat und darauf wird sie nicht verzichten. Und sie wird auch keine Lust haben, umständliche Abrechnungsverfahren zu machen oder gar in ihr Musikzimmer einen PC mit allem drum und dran zu stellen damit sie die Chipkarten abrechnen kann.

Der nächste Knackpunkt beim Thema Musiklehrer dürfte in den Kosten liegen. Mit den 60 Euro im Monat für den Klavierunterricht ist es ja nicht getan, das Notenmaterial muss getrennt beschafft und bezahlt werden und für einen erfolgreichen Unterricht braucht es daheim auch ein geeignetes Musikinstrument zum Üben. Das kostet aber je nach Instrument ziemlich heftig, ein Klavier dürfte vom Hartz-IV-Satz nicht bezahlbar sein. Begabte Kinder haben also keine Chance oder dürfen dann eben nur Blockflöte spielen, denn da gibt es das günstigste Instrument ja schon für unter 20 Euro?

Das eigentliche Problem mit Chipkarten und Gutscheinen haben wir aber noch gar nicht erwähnt. Wenn die Eltern des Kindes tatsächlich dem vorgeblichen Klischee entsprechen und ihr Geld lieber in Alkohol und Zigaretten investieren, dann hat das Kind trotz staatlicher Förderung durch Gutscheine oder Chipkarten ein ganz anderes Problem: Wie kommt es zum Sportverein oder Musikunterricht? Ich bin mehrere Stunden in der Woche unterwegs um meine Kinder zu diversen Freizeitaktivitäten zu fahren, aber die Klischee-Eltern die ihr Geld lieber versaufen werden das wohl kaum tun. Das Kind wäre also mit den finanziellen Möglichkeiten ausgestattet, kann sie aber nicht nutzen weil es als Kind weder einen Überblick hat welche Sportvereine es gibt oder welche Musiklehrer am Ort sind. Selbst hier in einer „besseren“ Gegend sehe ich täglich die selben Kinder auf dem Spielplatz und frage mich, ob die nicht auch gerne mal Sportverein oder Musikunterricht machen würden und das aber von ihren gut gestellten Eltern nicht gefördert wird. Illusorisch also zu glauben die miesen Klischee-Eltern würden dann ihren Hintern vom Sofa hochkriegen um für die Tochter eine Musikschule zu suchen.

Als Folge daraus werden, und das weiß die Arbeitsministerin ganz genau, dann eben nicht die zur Verfügung stehenden Mittel ausgeschöpft und damit kann man dann ganz toll begründen, dass man sich beim Bedarf verkalkuliert hat und diesen dann im nächsten Jahr rigoros zusammenstreichen kann. Im Rahmen der 5 Euro Erhöhung sagt Frau von der Leyen ja selbst:

Der Bedarf von Kindern ist eine absolute Blackbox für uns gewesen.

Das muss man sich mal auf der Zunge zergehen lassen, die Frau die bis vor kurzem noch die Familienministerin war („ja denkt denn keiner an die Kinder“) hat keinerlei Ahnung vom tatsächlichen Bedarf der Kinder.

Und statt gesundem Menschenverstand bemüht dann der Politiker die Statistik. So jetzt eben auch bei der Berechnung des Regelsatzes, da kommt dann ein Posten von 2,66 Euro raus für die Praxisgebühr beim Arzt. Die beträgt aber eigentlich 10 Euro im Vierteljahr und nicht 8 Euro, der bescheuerte Wert kommt eben heraus, wenn die untersuchte Stichprobe ihr Budget nicht ausgeschöpft hat. Wer schon mal mit Erbsenzählern zu tun gehabt hat kennt das, vor Geschäftsjahresende verpulvert man dann lieber übriges Geld mehr oder weniger sinnlos als zu riskieren, dass im neuen Jahr das Budget gekürtz wird weil es vorher nicht ausgeschöpft wurde.

Mein persönliches Fazit des ganzen ist daher, dass man hier wohl nur wieder einen Papiertiger schaffen will der in der Chipkartenversion dann auch noch irgend einen Infrastrukturhersteller subventioniert. Die Kinder werden nicht viel davon haben, denn um Kindern tatsächlich zu helfen und ihre Begabungen zu fördern braucht es mehr als Geld. Es braucht Menschen, die auf die Kinder zugehen und ihnen helfen. Aber Menschen haben in dieser Republik ja schon längst nur noch einen untergeordneten Stellenwert.

Was macht eigentlich mein Blutdruck?

Nachdem der Beginn der täglichen Messerei jetzt gut 2 Monate her ist wird es Zeit, mal wieder zu gucken, wie sich der Blutdruck nach Einnahme von Amlodipin verändert hat. Die aktuelle Graphik sieht so aus:

Und schon sehen wir das Problem. Bei knapp 120 Messwerten wird so ein Graph schon sehr unübersichtlich. Klar, die Tendenz in die gesundheitlich richtige Richtung kann man daraus schon ablesen, aber je mehr Daten da im Plot landen umso unübersichtlicher wird er werden. Zeit also, die Daten ein wenig einzugrenzen. Dazu habe ich mir in R eine einfache Funktion definiert, die die Datenwerte auf die „letzten x Werte“ beschränkt. Also z.B. die letzten 60 Werte, dann deckt man bei zwei Blutdruckmessungen pro Tag ungefähr einen Monat ab.

Zudem stellt sich die Frage, was mich wirklich interessiert. Das ist z.B. die Frage, wie oft sich der Blutdruck in bestimmten Bereichen befunden hat. Also die klassische Aufgabe für einen Histogramm-Plot. Oder derer zwei weil wir ja zwei Werte kontrollieren wollen. In R ist das ganz einfach, das „schwierigste Problem“ war rauszufinden, wie ich zwei Graphen in ein Bild kriege (hier lautet die Lösung par(mfcol=c(rows,colums)) ). Das Histogramm der letzten 60 Messungen sieht momentan so aus:

Und hey, mit diesen Werten bin ich aktuell durchaus zufrieden. der hohe Dia-Wert ist weg und es bewegt sich in Bereichen die für mein Alter durchaus akzeptabel sind.

RR.R

Nein, meine „R“-Taste klemmt nicht und ich bin auch nicht geknebelt und kann nur noch „RR.R“ sagen. Aber ich habe eine weitere schöne Anwendung für das Statistiktool „R“ gefunden. Aktuell kämpfe ich nämlich mit zu hohem Blutdruck und da ich nicht vorhabe diesen Kampf zu verlieren habe ich mal angefangen, Messwerte zu sammeln. Dazu habe ich mir letzte Woche ein Visomat 20/40 Blutdruckmessgerät in der Apotheke gekauft, das misst den Blutdruck mit einer Oberarmmanschette. Des Weiteren gab es von Amazon das Buch „Bluthochdruck für Dummies“ das die Probleme sehr gut beschreibt und auch Gegenmaßnahmen aufzeigt.

Die schlechte Nachricht: Um das Problem zu lösen heißt es

  • gesündere Ernährung, wenig Salz was für mich den Verzicht auf meine geliebten Paprika Chips bedeutet
  • Mehr Bewegung (gottseidank haben wir Lucy die uns auch bei Regenwetter zur Bewegung bringt)
  • abnehmen (mal wieder 🙂 )

Als Erfolgskontrolle schreibe ich die jeweiligen Messwerte auf und tippe sie auch in eine Datei die einfach das Datum/Uhrzeit und die Werte enthält. Da Abnehmen auch notwendig ist habe ich in einer zweiten Datei mein tägliches Gewicht drin (bislang nur ein Meßpunkt von heute).

Das ganze kann dann mit ein paar Zeilen in „R“ in ein anschauliches Bild umgewandelt werden:

Plot der MeßwerteKeine Panik, das ist kein unkontrollierter Selbstversuch. Natürlich war ich gestern beim Hausarzt und werfe seit heute auch Pillen gegen den hohen Blutdruck ein. Und in den nächsten Wochen werde ich in Sachen Blutdruck gründlich durchgecheckt werden, heute morgen gab es schon mal das „oazapft is“ an meinem Blutkreislauf damit das Labor was zum Auswerten hat.

Bis zu meinem Geburtstag in etwas mehr als 7 Wochen möchte ich meinen Blutdruck auf jeden Fall wieder in gesünderen Bereichen haben als jetzt. Und weniger Gewicht würde auch nicht schaden. In ein paar Wochen wirds hier im Blog eine aktualisierte Statistik geben.

Ach ja, passend zum Thema „R“ hat der Schockwellenreiter heute ein paar Buchtipps. Mir hat aber bislang die online-Dokumentation ausgereicht, allerdings ist das was ich bis jetzt mit R mache auch mehr Spielerei als ernsthafte Statistik.

Das beste Auto ist ein Porsche 911

Das behauptet der TÜV aktuell. Und das kann der TÜV sogar begründen:

Nur 1,9 Prozent der Sportwagen fielen bei der ersten Hauptuntersuchung drei Jahre nach der Erstzulassung wegen erheblicher Mängel durch.

Also mal ehrlich: Wenn ich mit meinem Auto beim TÜV antanze, dann doch nachdem ich in meiner Werkstatt war, bzw. ich beauftrage die Werkstatt, den Wagen soweit zu warten, dass der TÜV keinen Ärger macht. Wenn also sozusagen noch fast jeder 50. Porsche nach drei Jahren durchfällt, dann würde ich das jetzt nicht als Qualitätsmerkmal vermarkten.

Das alte Autos durchfallen und viele von der Finanzkrise geplagte Autofahrer es halt erst mal probieren bevor sie Geld für eine Instandsetzung abdrücken müssen ist durchaus nachvollziehbar. Aber hey, Porsche-Fahrer sollten sich auch eine gute Werkstatt leisten können und die sollte in der Lage sein, die Durchfallquote bei Null zu halten.

Letztlich dürfte die Pannenstatistik des ADAC viel genauer und aussagekräftiger sein wie diese TÜV-Statistik. Aber mit Statistik kann man ja fast alles beweisen. Aber vielleicht brauchte Porsche ein wenig Product-Placement, denn heute melden die Nachrichten ja Dinge wie „Porsche verbucht Umsatzrückgang„.

Kampagnenjournalismus?

Gestern abend tauchte ein Artikel der AZ in meinem Newsfeed auf der eigentlich nur unter der Kategorie „Kampagnenjournalismus“ abgeheftet werden kann. Heute sprang mich der Artikel dann von Seite 2 der Augsburger Allgemeinen an. Es geht um die Studiengebühren und die Aussage, dass diese für Studenten nicht abschreckend sind:

Doch all das scheint trotzdem niemanden von einem Studium abzuschrecken: 423 400 Abiturienten haben nach der neuen Hochschulstatistik des Statistischen Bundesamtes in diesem Jahr ein Studium begonnen, das waren drei Prozent mehr als noch im Vorjahr.

Na, das sind ja hervorragende Nachrichten. Am Anstieg eines statistischen Wertes erkennen wir sofort, dass Studiengebühren nicht abschreckend sind. Wenn man sich das ganze ohne die rosa Kampagnenbrille anguckt, fallen einem aber viele Dinge ein.

Wie hat sich im Beobachtungszeitraum die Zahl der Leute mit Hochschulreife entwickelt? Wenn wir hier z.B. 10% mehr Abiturienten hätten, dann wären 3% mehr die ein Studium anfangen eigentlich ein Rückgang.  Diese Frage wird dann sogar eigentlich bestätigt, wenn man ein paar Sätze weiter liest:

„Das liegt vor allem daran, dass immer mehr Menschen eine Studienberechtigung erwerben“, sagt Pia Brugger, Referatsleiterin beim Statistischen Bundesamt.

Also haben wir mehr Menschen mit Studienberechtigung, klar dass wenn der gleiche Prozentsatz wie bisher sich dann fürs Studieren entscheidet das dann einen Zuwachs auch bei den Studienanfängern bewirkt. Apropos Studienanfänger. Vielleicht sollte man auch mal ein wenig über den statistischen Tellerrand hinausgucken und feststellen, dass wir gerade eine gewaltige Wirtschaftskrise haben. Firmen sind froh um jeden den sie „freisetzen“ dürfen und im Herbst durfte man in der Zeitung mehrere Seiten mit Kleinanzeigen bewundern in denen junge Leute verzweifelt einen Ausbildungsplatz suchen. Wäre ich heute mit dem Abi fertig, dann würde ich natürlich mich auch erst mal in Richtung „Studium“ orientieren, sozusagen die „Warteschleife im Jobmarkt mit dem Nebeneffekt der höheren Qualifikation“. Denn auch für Abiturienten scheinen die Ausbildungsplätze in der Wirtschaft rar zu sein.

Was also liegt näher, als in ein Studium einzusteigen. Augen zu und durch. Irgendwie wird es schon gehen. Und wenn es nicht geht, dann muss man eben sehen was man dann macht. Alternativ könnte ich auch jubeln, dass immer mehr Menschen sich als „Selbständige Unternehmer und Existenzgründer“ sehen und ihr Glück im eigenen Geschäftsmodell suchen. Kunststück, wenn am Arbeitsmarkt sonst nix zu holen ist außer ALG II. Diese Euphorie relativiert sich aber sehr schnell, wenn man guckt, wieviele dieser Selbständigkeitsträume zerplatzen und die Menschen danach mit Insolvenz und einem großen Schuldenberg dastehen. Ja, sie haben es versucht, aber sind dann letztlich doch auf der Strecke geblieben.

Die Frage wäre doch, wieiviele Studenten auf der Strecke bleiben, weil die Studiengebühren ja auch irgendwie finanziert werden wollen und man gezwungen ist, nebenbei und damit kontraproduktiv für das Studium zu jobben um das Geld irgendwie aufzutreiben.

Aber klar, da behauptet man lieber dass die Studentenzahlen ja steigen, soo schlimm kann es also gar nicht sein. Ich wage das Gegenteil zu behaupten und bin froh, dass mein Studium schon 25 Jahre her ist. Damals war Bildung noch „ohne“ Studiengebühren und sonstige „Aufwandsentschädigungen“ (Kopiergeld, etc.) zu haben. Aber heute lügt man lieber mit Statistik um Mißstände schönzureden.