<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:georss="http://www.georss.org/georss" xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#" xmlns:media="http://search.yahoo.com/mrss/"
	>

<channel>
	<title>mdzblog</title>
	<atom:link href="http://mdzblog.wordpress.com/feed/" rel="self" type="application/rss+xml" />
	<link>http://mdzblog.wordpress.com</link>
	<description>Der Blog des Münchener DigitalisierungsZentrums (MDZ) der Bayerischen Staatsbibliothek</description>
	<lastBuildDate>Mon, 21 Nov 2011 11:07:00 +0000</lastBuildDate>
	<language>de</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.com/</generator>
<cloud domain='mdzblog.wordpress.com' port='80' path='/?rsscloud=notify' registerProcedure='' protocol='http-post' />
<image>
		<url>http://1.gravatar.com/blavatar/32b90ab50de29b4d137c76717b780070?s=96&#038;d=http%3A%2F%2Fs2.wp.com%2Fi%2Fbuttonw-com.png</url>
		<title>mdzblog</title>
		<link>http://mdzblog.wordpress.com</link>
	</image>
	<atom:link rel="search" type="application/opensearchdescription+xml" href="http://mdzblog.wordpress.com/osd.xml" title="mdzblog" />
	<atom:link rel='hub' href='http://mdzblog.wordpress.com/?pushpress=hub'/>
		<item>
		<title>Videos endlich online!</title>
		<link>http://mdzblog.wordpress.com/2011/11/21/videos-endlich-online/</link>
		<comments>http://mdzblog.wordpress.com/2011/11/21/videos-endlich-online/#comments</comments>
		<pubDate>Mon, 21 Nov 2011 11:06:58 +0000</pubDate>
		<dc:creator>mdzblog</dc:creator>
				<category><![CDATA[Uncategorized]]></category>

		<guid isPermaLink="false">http://mdzblog.wordpress.com/?p=305</guid>
		<description><![CDATA[Es hat dann doch etwas länger gedauert, aber jetzt sind alle Vorträge unserer Doppel-Veranstaltung &#8222;Historische Dokumente auf dem Weg zum digitalen Volltext&#8220; (11. &#8211; 12. Oktober 2011) und in die entsprechenden Blog-Artikel eingebunden. Wie gehabt finden sich alle Informationen zum &#8230; <a href="http://mdzblog.wordpress.com/2011/11/21/videos-endlich-online/">Weiterlesen <span class="meta-nav">&#8594;</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=305&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p>Es hat dann doch etwas länger gedauert, aber jetzt sind alle Vorträge unserer Doppel-Veranstaltung &#8222;Historische Dokumente auf dem Weg zum digitalen Volltext&#8220; (11. &#8211; 12. Oktober 2011) und in die entsprechenden Blog-Artikel eingebunden.</p>
<p>Wie gehabt finden sich alle Informationen zum zweiten Tag, den &#8222;Erfahrungen aus der Digitalisierungspraxis&#8220;, hier auf dem mdzblog, während Sie sich alles Wissenswerte zum ersten Tag, dem &#8222;IMPACT Demo Day&#8220; auf dem <a title="IMPACT-Blog" href="http://impactocr.wordpress.com/" target="_blank">Blog des IMPACT-Projektes</a> zu Gemüte führen können.</p>
<p>Viel Vergnügen beim Ansehen!</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-</p>
<p>It took us a bit longer than expected, but all videos of our dual event &#8222;Turning Historical Documents into Digital Full Texts&#8220; (11 &#8211; 12 October 2011) are now online and embedded into the relevant blog posts.</p>
<p>For the second day, you&#8217;ll find them here on the mdzblog. For the first day, please visit the <a title="IMPACT blog" href="http://impactocr.wordpress.com/" target="_blank">blog of the IMPACT project</a>.</p>
<p>Have fun watching!</p>
<p>&nbsp;</p>
<p><em>Mark-Oliver Fischer</em></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/mdzblog.wordpress.com/305/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/mdzblog.wordpress.com/305/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/mdzblog.wordpress.com/305/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/mdzblog.wordpress.com/305/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/mdzblog.wordpress.com/305/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/mdzblog.wordpress.com/305/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/mdzblog.wordpress.com/305/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/mdzblog.wordpress.com/305/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/mdzblog.wordpress.com/305/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/mdzblog.wordpress.com/305/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/mdzblog.wordpress.com/305/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/mdzblog.wordpress.com/305/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/mdzblog.wordpress.com/305/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/mdzblog.wordpress.com/305/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=305&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://mdzblog.wordpress.com/2011/11/21/videos-endlich-online/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/581ab80a14f5c491e3e8d85564722aa4?s=96&#38;d=http%3A%2F%2F1.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D96&#38;r=PG" medium="image">
			<media:title type="html">mdzblog</media:title>
		</media:content>
	</item>
		<item>
		<title>Impressionen und überarbeitete Artikel</title>
		<link>http://mdzblog.wordpress.com/2011/10/21/impressionen/</link>
		<comments>http://mdzblog.wordpress.com/2011/10/21/impressionen/#comments</comments>
		<pubDate>Fri, 21 Oct 2011 10:20:53 +0000</pubDate>
		<dc:creator>mdzblog</dc:creator>
				<category><![CDATA["Historische Dokumente" Okt. 2011]]></category>
		<category><![CDATA[Veranstaltungen]]></category>

		<guid isPermaLink="false">http://mdzblog.wordpress.com/?p=267</guid>
		<description><![CDATA[Eine Woche nach unserer sehr erfolgreichen Veranstaltung unter dem Namen &#8222;Historische Dokumente auf dem Weg zum digitalen Volltext&#8220; haben wir uns alle Artikel noch mal angesehen und, wo nötig, überarbeitet, um sprachliche und inhaltliche Schwächen zu beseitigen. Wenn man einen &#8230; <a href="http://mdzblog.wordpress.com/2011/10/21/impressionen/">Weiterlesen <span class="meta-nav">&#8594;</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=267&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<div>
<a href="http://mdzblog.wordpress.com/2011/10/21/impressionen/#gallery-1-slideshow">Anklicken um </a>
<p>Eine Woche nach unserer sehr erfolgreichen Veranstaltung unter dem Namen &#8222;Historische Dokumente auf dem Weg zum digitalen Volltext&#8220; haben wir uns alle Artikel noch mal angesehen und, wo nötig, überarbeitet, um sprachliche und inhaltliche Schwächen zu beseitigen. Wenn man einen Vortrag live mitschreibt, klingt Manches doch mal holpriger, als man gerne hätte. Außerdem wurden inzwischen die Präsentationen zu allen Vorträgen eingebunden. Einige Leser des Blogs warten sicher auch sehr gespannt auf die Videos der Vorträge. Leider muss ich Sie diesbezüglich noch vertrösten, da ich mich vermutlich erst im November wieder darum kümmern kann, dann aber mit Hochdruck. Versprochen!</p>
<p>Ein Dank geht an unsere Praktikantinnen RM und VD, ohne die es hier nur wenig zu sehen gäbe, da sie sich am Veranstaltungstag fleißig um die Blogartikel und Videomitschnitte gekümmert haben.</p>
<p><span style="text-decoration:underline;">                                                                            </span></p>
<p>One week after our very successful event &#8222;Turning Historical Documents into Digital Full Texts&#8220;, we had a look at all articles and reworded them were necessary, to weed out factual, grammatical and spelling errors. Turns out blogging live just isn’t that easy. The presentations slides were added to all talks, the videos of all the talks will take a a little while longer, as I don’t have the time to work on them yet. But in early November, there should be nothing keeping me away from them any longer.</p>
<p>I would also like to thank our interns RM and VD, without whom there wouldn’t be a lot to see here, as they filmed and blogged tirelessly on the day of the event.</p>
<p>&nbsp;</p>
<p><em>Mark-Oliver Fischer (BSB)</em></p>
</div>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/mdzblog.wordpress.com/267/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/mdzblog.wordpress.com/267/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/mdzblog.wordpress.com/267/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/mdzblog.wordpress.com/267/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/mdzblog.wordpress.com/267/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/mdzblog.wordpress.com/267/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/mdzblog.wordpress.com/267/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/mdzblog.wordpress.com/267/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/mdzblog.wordpress.com/267/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/mdzblog.wordpress.com/267/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/mdzblog.wordpress.com/267/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/mdzblog.wordpress.com/267/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/mdzblog.wordpress.com/267/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/mdzblog.wordpress.com/267/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=267&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://mdzblog.wordpress.com/2011/10/21/impressionen/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/581ab80a14f5c491e3e8d85564722aa4?s=96&#38;d=http%3A%2F%2F1.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D96&#38;r=PG" medium="image">
			<media:title type="html">mdzblog</media:title>
		</media:content>
	</item>
		<item>
		<title>Veranstaltungsende</title>
		<link>http://mdzblog.wordpress.com/2011/10/13/veranstaltungsende/</link>
		<comments>http://mdzblog.wordpress.com/2011/10/13/veranstaltungsende/#comments</comments>
		<pubDate>Thu, 13 Oct 2011 12:30:46 +0000</pubDate>
		<dc:creator>mdzblog</dc:creator>
				<category><![CDATA["Historische Dokumente" Okt. 2011]]></category>
		<category><![CDATA[Veranstaltungen]]></category>

		<guid isPermaLink="false">http://mdzblog.wordpress.com/?p=156</guid>
		<description><![CDATA[Mit dem zweiten Veranstaltungstag mit dem Titel &#8222;Erfahrungen aus der Digitalisierungspraxis: OCR, Volltexte und Präsentationsformen&#8220; endet nun der OCR-Workshop unter dem Motto &#8222;Historische Dokumente auf dem Weg zum digitalen Volltext&#8220;. Das Münchener Digitalisierungszentrum bedankt sich recht herzlich bei den Referenten und Sponsoren, die &#8230; <a href="http://mdzblog.wordpress.com/2011/10/13/veranstaltungsende/">Weiterlesen <span class="meta-nav">&#8594;</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=156&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<div>
<p>Mit dem zweiten Veranstaltungstag mit dem Titel &#8222;Erfahrungen aus der Digitalisierungspraxis: OCR, Volltexte und Präsentationsformen&#8220; endet nun der OCR-Workshop unter dem Motto &#8222;Historische Dokumente auf dem Weg zum digitalen Volltext&#8220;.</p>
<p>Das Münchener Digitalisierungszentrum bedankt sich recht herzlich bei den Referenten und Sponsoren, die den fachlichen Austausch im Rahmen dieser Veranstaltung erst möglich gemacht haben!</p>
<p>Wir sind bemüht, Videos und Präsentationsfolien möglichst bald zur Verfügung zu stellen.<br />
________________________</p>
<p>Hereby the second part and therefore the OCR workshop in Munich ended. Many thanks to the lecturers and sponsors who enabled the exchange of information.</p>
<p>&nbsp;</p>
<p><em>RM</em></p>
</div>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/mdzblog.wordpress.com/156/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/mdzblog.wordpress.com/156/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/mdzblog.wordpress.com/156/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/mdzblog.wordpress.com/156/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/mdzblog.wordpress.com/156/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/mdzblog.wordpress.com/156/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/mdzblog.wordpress.com/156/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/mdzblog.wordpress.com/156/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/mdzblog.wordpress.com/156/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/mdzblog.wordpress.com/156/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/mdzblog.wordpress.com/156/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/mdzblog.wordpress.com/156/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/mdzblog.wordpress.com/156/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/mdzblog.wordpress.com/156/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=156&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://mdzblog.wordpress.com/2011/10/13/veranstaltungsende/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/581ab80a14f5c491e3e8d85564722aa4?s=96&#38;d=http%3A%2F%2F1.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D96&#38;r=PG" medium="image">
			<media:title type="html">mdzblog</media:title>
		</media:content>
	</item>
		<item>
		<title>Anforderungen an die Präsentation barrierefreier, digitaler Bibliotheksangebote</title>
		<link>http://mdzblog.wordpress.com/2011/10/12/anforderungen-an-die-prasentation-barrierefreier-digitaler-bibliotheksangebote/</link>
		<comments>http://mdzblog.wordpress.com/2011/10/12/anforderungen-an-die-prasentation-barrierefreier-digitaler-bibliotheksangebote/#comments</comments>
		<pubDate>Wed, 12 Oct 2011 16:38:02 +0000</pubDate>
		<dc:creator>mdzblog</dc:creator>
				<category><![CDATA["Historische Dokumente" Okt. 2011]]></category>
		<category><![CDATA[Veranstaltungen]]></category>

		<guid isPermaLink="false">http://mdzblog.wordpress.com/?p=55</guid>
		<description><![CDATA[Matthias Leopold von der Deutschen Zentralbücherei für Blinde zu Leipzig sprach über die Anforderungen an die Präsentation barrierefreier, digitaler Bibliotheksangebote. Er erläuterte anfänglich, was unter Barrierefreiheit zu verstehen ist und gab einen Überblick über die rechtlichen Rahmenbedingungen der Arbeit der &#8230; <a href="http://mdzblog.wordpress.com/2011/10/12/anforderungen-an-die-prasentation-barrierefreier-digitaler-bibliotheksangebote/">Weiterlesen <span class="meta-nav">&#8594;</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=55&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<div class='embed-vimeo' style='text-align:center;'><iframe src='http://player.vimeo.com/video/32267458' width='400' height='300' frameborder='0'></iframe></div>
<iframe src='http://www.slideshare.net/slideshow/embed_code/9695956' width='584' height='479'></iframe>
<p><em><br />
</em></p>
<p>Matthias Leopold von der Deutschen Zentralbücherei für Blinde zu Leipzig sprach über die Anforderungen an die Präsentation barrierefreier, digitaler Bibliotheksangebote.</p>
<p>Er erläuterte anfänglich, was unter Barrierefreiheit zu verstehen ist und gab einen Überblick über die rechtlichen Rahmenbedingungen der Arbeit der DZB (§ 45a UrhG). Sie produziere beispielsweise Braille-Bücher, Musikalien, navigierbare Hörbücher und Großdrucke. Der Hauptanteil der Literatur stamme bisher aus dem belletristischen Genre, es werde aber vermehrt an der Bereitstellung von Sach- und Fachbüchern gearbeitet.</p>
<p>OCR-Fehler wirkten sich bei der Umwandlung in Brailleschrift sehr viel stärker und sinnentstellender aus als bei &#8216;normaler&#8217; Schrift, zusätzlich stelle die Linearisierung, also die Wiedergabe der Leserichtung ein großes Problem dar.</p>
<p>Bibliotheken sollten bedenken, dass für blinde und sehbehinderte Menschen der Zugang zu medialen Inhalten als Studien- und Arbeitsmittel von genauso hoher Bedeutung sei wie für gut Sehende. Daher sollten sie digitalisierte Inhalte möglichst hoch strukturiert und damit auch für diese Zielgruppen navigierbar angeboten werden.</p>
<p>Darüber hinaus führe die Beachtung von Konzepten der Barrierefreiheit nicht nur zum Abbau von Barrieren für Behinderte, allgemein lasse sich auf diese Weise eine benutzerfreundlichere Mediennutzung erreichen.</p>
<p><span style="text-decoration:underline;">                                                                      </span></p>
<p>Matthias Leopold of the German Central Library for the Blind talked about the invaluable service his institution provides for sight-impaired people, by creating braille or audio versions of fiction and non-fiction books. He talked about the concept of accessibility, what libraries can do to follow it and how this can lead to better services for all users, impaired or not.</p>
<p>&nbsp;</p>
<p><em>VD; Mark-Oliver Fischer<br />
</em></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/mdzblog.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/mdzblog.wordpress.com/55/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/mdzblog.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/mdzblog.wordpress.com/55/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/mdzblog.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/mdzblog.wordpress.com/55/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/mdzblog.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/mdzblog.wordpress.com/55/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/mdzblog.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/mdzblog.wordpress.com/55/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/mdzblog.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/mdzblog.wordpress.com/55/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/mdzblog.wordpress.com/55/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/mdzblog.wordpress.com/55/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=55&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://mdzblog.wordpress.com/2011/10/12/anforderungen-an-die-prasentation-barrierefreier-digitaler-bibliotheksangebote/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/581ab80a14f5c491e3e8d85564722aa4?s=96&#38;d=http%3A%2F%2F1.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D96&#38;r=PG" medium="image">
			<media:title type="html">mdzblog</media:title>
		</media:content>
	</item>
		<item>
		<title>Präsentation von Zeitungs-Volltexten im Internet</title>
		<link>http://mdzblog.wordpress.com/2011/10/12/prasentation-von-zeitungs-volltexten-im-internet/</link>
		<comments>http://mdzblog.wordpress.com/2011/10/12/prasentation-von-zeitungs-volltexten-im-internet/#comments</comments>
		<pubDate>Wed, 12 Oct 2011 16:05:59 +0000</pubDate>
		<dc:creator>mdzblog</dc:creator>
				<category><![CDATA["Historische Dokumente" Okt. 2011]]></category>
		<category><![CDATA[Veranstaltungen]]></category>

		<guid isPermaLink="false">http://mdzblog.wordpress.com/?p=53</guid>
		<description><![CDATA[Christa Müller von der Österreichischen Nationalbibliothek präsentierte ANNO – AustriaN Newspapers Online. Auf dem seit Mai 2003 bestehenden Portal stünden ca. 190 historische österreichische Zeitungs- und Zeitschriftentitel frei und kostenlos für interessierte Leser zur Verfügung. Weitere Titel und Jahrgänge würden &#8230; <a href="http://mdzblog.wordpress.com/2011/10/12/prasentation-von-zeitungs-volltexten-im-internet/">Weiterlesen <span class="meta-nav">&#8594;</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=53&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<div class='embed-vimeo' style='text-align:center;'><iframe src='http://player.vimeo.com/video/32266932' width='400' height='300' frameborder='0'></iframe></div>
<iframe src='http://www.slideshare.net/slideshow/embed_code/9695663' width='584' height='479'></iframe>
<p><em><br />
</em></p>
<p>Christa Müller von der Österreichischen Nationalbibliothek präsentierte <a title="ANNO - AustriaN Newspapers Online" href="http://anno.onb.ac.at/" target="_blank">ANNO – AustriaN Newspapers Online</a>. Auf dem seit Mai 2003 bestehenden Portal stünden ca. 190 historische österreichische Zeitungs- und Zeitschriftentitel frei und kostenlos für interessierte Leser zur Verfügung. Weitere Titel und Jahrgänge würden regelmäßig dazu kommen.</p>
<p>Da von Zeitungen als &#8222;Verbrauchsgut&#8220; oft nur wenige Exemplare erhalten seien, arbeite die Österreichische Nationalbibliothek mit Kooperationspartnern zusammen, um eigene Lücken zu schließen und den Bestand so digital komplettieren zu können.</p>
<p>Es werde vom Papiermaterial gescannt, da dies &#8211; wie in Tests vorab festgestellt worden sei &#8211; eine bessere OCR-Qualität ermögliche. Schwierigkeiten für die OCR lägen in der ungleichmäßigen Verteilung der Druckerschwärze auf einem dünnen Papier, dem großen Format und der Einteilung in Spalten, der kleinen Schrift und dem Vorkommen vieler Eigennamen.</p>
<p>Diese Probleme beeinflussten auch die Qualität der Suchergebnisse. Eine Lösung hierfür könnten beispielsweise besondere Formen der Filterung sein (z.B. die Suche mit einem Ersatzzeichen für den ersten Großbuchstaben bei Wörtern in Frakturschrift, der oft nicht von der OCR erkannt werde). Für einige Zeitschriften existiere auch bereits eine Erschließung der Inhaltsverzeichnisse als HTML-verlinkter Text (durchsuchbar nach AutorIn, Artikeltitel, Jahr und Ort). Insgesamt sei bei der Frage nach der Durchsuchbarkeit OCR-erkannter Texte aber noch viel zu tun.</p>
<p><span style="text-decoration:underline;">                                       </span></p>
<p>Christa Müller of the Austrian National Library presented <a title="ANNO - AustriaN Newspapers Online" href="http://anno.onb.ac.at/" target="_blank">ANNO – AustriaN Newspapers Online</a>, which provides free access to 190 historical Austrian newspapers and magazines. Her focus was on the problem of getting accurate search results from a faulty OCRed full text.</p>
<p>&nbsp;</p>
<p><em>VD; Mark-Oliver Fischer<br />
</em></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/mdzblog.wordpress.com/53/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/mdzblog.wordpress.com/53/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/mdzblog.wordpress.com/53/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/mdzblog.wordpress.com/53/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/mdzblog.wordpress.com/53/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/mdzblog.wordpress.com/53/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/mdzblog.wordpress.com/53/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/mdzblog.wordpress.com/53/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/mdzblog.wordpress.com/53/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/mdzblog.wordpress.com/53/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/mdzblog.wordpress.com/53/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/mdzblog.wordpress.com/53/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/mdzblog.wordpress.com/53/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/mdzblog.wordpress.com/53/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=53&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://mdzblog.wordpress.com/2011/10/12/prasentation-von-zeitungs-volltexten-im-internet/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/581ab80a14f5c491e3e8d85564722aa4?s=96&#38;d=http%3A%2F%2F1.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D96&#38;r=PG" medium="image">
			<media:title type="html">mdzblog</media:title>
		</media:content>
	</item>
		<item>
		<title>Buch-Volltexte der BSB im Internet</title>
		<link>http://mdzblog.wordpress.com/2011/10/12/buch-volltexte-der-bsb-im-internet/</link>
		<comments>http://mdzblog.wordpress.com/2011/10/12/buch-volltexte-der-bsb-im-internet/#comments</comments>
		<pubDate>Wed, 12 Oct 2011 15:32:10 +0000</pubDate>
		<dc:creator>mdzblog</dc:creator>
				<category><![CDATA["Historische Dokumente" Okt. 2011]]></category>
		<category><![CDATA[Veranstaltungen]]></category>

		<guid isPermaLink="false">http://mdzblog.wordpress.com/?p=51</guid>
		<description><![CDATA[Dirk Scholz von der Bayerischen Staatsbibliothek referierte über Buch-Volltexte der BSB im Internet. Als Beispiele für Volltextangebote nannte er dMGH, Digi20, Leibniz Publik, Ostdok und Bavarica-Volltexte, welche sich sowohl in ihrer äußerlichen Erscheinungsweise als auch in ihren Funktionalitäten ähneln. Er &#8230; <a href="http://mdzblog.wordpress.com/2011/10/12/buch-volltexte-der-bsb-im-internet/">Weiterlesen <span class="meta-nav">&#8594;</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=51&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<div class='embed-vimeo' style='text-align:center;'><iframe src='http://player.vimeo.com/video/32322190' width='400' height='300' frameborder='0'></iframe></div>
<iframe src='http://www.slideshare.net/slideshow/embed_code/9695602' width='584' height='479'></iframe>
<p><em><br />
</em></p>
<p>Dirk Scholz von der Bayerischen Staatsbibliothek referierte über Buch-Volltexte der BSB im Internet. Als Beispiele für Volltextangebote nannte er <a title="dMGH" href="http://www.dmgh.de/">dMGH</a>, <a title="Digi20" href="http://digi20.digitale-sammlungen.de/">Digi20</a>, <a title="Leibniz Publik" href="http://www.leibniz-publik.de/">Leibniz Publik</a>, <a title="Ostdok" href="http://www.ostdok.de/ostdok/">Ostdok</a> und <a title="Bavarica-Volltexte" href="http://bavarica.digitale-sammlungen.de/">Bavarica-Volltexte</a>, welche sich sowohl in ihrer äußerlichen Erscheinungsweise als auch in ihren Funktionalitäten ähneln.</p>
<p>Er stellte im Folgenden den standardisierten Workflow von der Digitalisierung über die OCR-Erfassung (beide gesteuert durch die ZEND, die Zentrale Erfassungs- und Nachweisdatenbank) bis zur Webbereitstellung dar, um einen Einblick zu gewähren, wie diese Standardfunktionalitäten zustande kommen.</p>
<p>Zentral für die Digitalisierung sei der Grundsatz &#8222;Kein Digitalisat ohne Katalogisat&#8220;. Für die OCR-Verarbeitung werde im Regelfall mit 400 dpi und Graustufen gescannt. Die OCR-Erfassung erfolge &#8211; sofern nicht über Dienstleister oder im Rahmen der Kooperation mit Google &#8211; über den ABBYY Recognition Server, da dieser bei internen Tests die besten und am einfachsten weiterzuverarbeitenden Ergebnisse geliefert habe. Für die OCR-Erfassung liefen bis zu drei Workflows parallel, von denen zwei die Möglichkeit der Nachkorrektur von Ergebnissen über die sogenannten &#8216;Korrekturstationen&#8217; ermöglichten. Diese würden aber auf Grund des Arbeitsaufwands und technischer Schwierigkeiten bisher nur bei Ostdok eingesetzt.</p>
<p>Grundlage für die Webbereitstellung seien die Bilddateien, die Volltexte inklusive Koordinaten auf Buchstabenebene und Strukturdaten. Als Format werde TEI-konformes xml verwendet. Über <a title="GATE" href="http://gate.ac.uk/ie/">GATE</a> erfolge eine automatische Extraktion von Orts- und Personennamen, die zur facettierten Suche bereitstünden.</p>
<p>Zu Bedenken sei auch, dass dieser Workflow auf den Massendurchfluss ausgerichtet sei, und daher soweit wie möglich ohne manuelles Eingreifen zu funktionieren habe.</p>
<p><span style="text-decoration:underline;">                                                  </span></p>
<p>Dirk Scholz of the Bavarian State Library talked about the presentation of full texts in its different projects. He gave a thorough overview of the workflow, which is tailored for mass processing of millions of pages.</p>
<p>&nbsp;</p>
<p><em>VD; Mark-Oliver Fischer<br />
</em></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/mdzblog.wordpress.com/51/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/mdzblog.wordpress.com/51/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/mdzblog.wordpress.com/51/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/mdzblog.wordpress.com/51/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/mdzblog.wordpress.com/51/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/mdzblog.wordpress.com/51/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/mdzblog.wordpress.com/51/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/mdzblog.wordpress.com/51/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/mdzblog.wordpress.com/51/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/mdzblog.wordpress.com/51/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/mdzblog.wordpress.com/51/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/mdzblog.wordpress.com/51/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/mdzblog.wordpress.com/51/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/mdzblog.wordpress.com/51/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=51&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://mdzblog.wordpress.com/2011/10/12/buch-volltexte-der-bsb-im-internet/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/581ab80a14f5c491e3e8d85564722aa4?s=96&#38;d=http%3A%2F%2F1.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D96&#38;r=PG" medium="image">
			<media:title type="html">mdzblog</media:title>
		</media:content>
	</item>
		<item>
		<title>Erfahrungsbericht: Kollaborative Korrektur</title>
		<link>http://mdzblog.wordpress.com/2011/10/12/erfahrungsbericht-kollaborative-korrektur/</link>
		<comments>http://mdzblog.wordpress.com/2011/10/12/erfahrungsbericht-kollaborative-korrektur/#comments</comments>
		<pubDate>Wed, 12 Oct 2011 14:36:04 +0000</pubDate>
		<dc:creator>mdzblog</dc:creator>
				<category><![CDATA["Historische Dokumente" Okt. 2011]]></category>
		<category><![CDATA[Veranstaltungen]]></category>

		<guid isPermaLink="false">http://mdzblog.wordpress.com/?p=49</guid>
		<description><![CDATA[Constanze Hofmann von Distributed Proofreaders berichtete über die kollaborative Produktion elektronischer Bücher. Distributed Proofreaders unterstütze seit 2000 das bereits 1971 gegründete Project Gutenberg ehrenamtlich dabei, gemeinfreie Bücher jedermann kostenfrei und in verschiedenen elektronischen Formaten zugänglich zu machen. Project Gutenberg habe &#8230; <a href="http://mdzblog.wordpress.com/2011/10/12/erfahrungsbericht-kollaborative-korrektur/">Weiterlesen <span class="meta-nav">&#8594;</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=49&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p style="text-align:left;"><div class='embed-vimeo' style='text-align:center;'><iframe src='http://player.vimeo.com/video/32266856' width='400' height='300' frameborder='0'></iframe></div></p>
<iframe src='http://www.slideshare.net/slideshow/embed_code/9695560' width='584' height='479'></iframe>
<p><em><br />
</em></p>
<p>Constanze Hofmann von <a title="Distributed Proofreaders" href="http://www.pgdp.net/c/">Distributed Proofreaders</a> berichtete über die kollaborative Produktion elektronischer Bücher.</p>
<p>Distributed Proofreaders unterstütze seit 2000 das bereits 1971 gegründete <a title="Project Gutenberg" href="http://www.gutenberg.org/">Project Gutenberg</a> ehrenamtlich dabei, gemeinfreie Bücher jedermann kostenfrei und in verschiedenen elektronischen Formaten zugänglich zu machen. Project Gutenberg habe mehr als 35.000 Bücher im Programm, von denen Distributed Proofreaders aktiv an über 21.000 Titeln mitgewirkt habe.</p>
<p>Mehr als 1000 Freiwillige arbeiteten wöchentlich an den digitalen Büchern. Der aktuell etablierte Workflow sehe vor, dass die eingescannten und OCR-erfassten Digitalisate insgesamt dreimal Korrektur gelesen werden. Die Formatierung der Texte erfolge davon unabhängig, in zwei Durchläufen, bevor die einzelnen Abschnitte zusammengefügt und eventuelle Illustrationen eingefügt werden.</p>
<p>Die Bearbeiter könnten sich ihre Rollen dabei nach ihren Interessen aussuchen, wobei einige Funktionen erst nach einer gewissen Zeit der Mitarbeit freigeschaltet werden würden. Um Neueinsteigern den Einstieg zu erleichtern, stünden spezielle Mentoren bereit, und auch  die Organisation des Projekts als Ganzes werde ausschließlich von Freiwilligen übernommen.</p>
<p><span style="text-decoration:underline;">                                                                          </span></p>
<p>Constanze Hofmann of<a title="Distributed Proofreaders" href="http://www.pgdp.net/c/"> Distributed Proofreaders</a> talked about the collaborative production of eBooks. Founded in 2000 to aid <a title="Project Gutenberg" href="http://www.gutenberg.org/">Project Gutenberg</a> in the creation of electronic versions of books in the public domain, the volunteers behind DP are now responsible for most of the titles released over Project Gutenberg.</p>
<p>&nbsp;</p>
<p><em>VD; Mark-Oliver Fischer<br />
</em></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/mdzblog.wordpress.com/49/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/mdzblog.wordpress.com/49/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/mdzblog.wordpress.com/49/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/mdzblog.wordpress.com/49/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/mdzblog.wordpress.com/49/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/mdzblog.wordpress.com/49/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/mdzblog.wordpress.com/49/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/mdzblog.wordpress.com/49/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/mdzblog.wordpress.com/49/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/mdzblog.wordpress.com/49/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/mdzblog.wordpress.com/49/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/mdzblog.wordpress.com/49/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/mdzblog.wordpress.com/49/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/mdzblog.wordpress.com/49/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=49&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://mdzblog.wordpress.com/2011/10/12/erfahrungsbericht-kollaborative-korrektur/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/581ab80a14f5c491e3e8d85564722aa4?s=96&#38;d=http%3A%2F%2F1.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D96&#38;r=PG" medium="image">
			<media:title type="html">mdzblog</media:title>
		</media:content>
	</item>
		<item>
		<title>Textvervollständigung, OCR- und Rechtschreibkorrektur: Drei Sichten auf gleiche Methoden</title>
		<link>http://mdzblog.wordpress.com/2011/10/12/textvervollstandigung-ocr-und-rechtschreibkorrektur-drei-sichten-auf-gleiche-methoden/</link>
		<comments>http://mdzblog.wordpress.com/2011/10/12/textvervollstandigung-ocr-und-rechtschreibkorrektur-drei-sichten-auf-gleiche-methoden/#comments</comments>
		<pubDate>Wed, 12 Oct 2011 13:59:52 +0000</pubDate>
		<dc:creator>mdzblog</dc:creator>
				<category><![CDATA["Historische Dokumente" Okt. 2011]]></category>
		<category><![CDATA[Veranstaltungen]]></category>

		<guid isPermaLink="false">http://mdzblog.wordpress.com/?p=47</guid>
		<description><![CDATA[Marco Büchler vom Lehrstuhl für Automatische Sprachverarbeitung an der Universität Leipzig beschäftigte sich mit Methoden des Text Mining, die durch Wissen über Textzusammenhänge zur Korrektur beziehungsweise Rekonstruktion von Texten dienen können. Diese Methoden können in den verschiedensten Umgebungen eingesetzt werden. &#8230; <a href="http://mdzblog.wordpress.com/2011/10/12/textvervollstandigung-ocr-und-rechtschreibkorrektur-drei-sichten-auf-gleiche-methoden/">Weiterlesen <span class="meta-nav">&#8594;</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=47&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<div class='embed-vimeo' style='text-align:center;'><iframe src='http://player.vimeo.com/video/32266733' width='400' height='300' frameborder='0'></iframe></div>
<iframe src='http://www.slideshare.net/slideshow/embed_code/9695449' width='584' height='479'></iframe>
<p><em><br />
</em></p>
<p>Marco Büchler vom Lehrstuhl für Automatische Sprachverarbeitung an der Universität Leipzig beschäftigte sich mit Methoden des Text Mining, die durch Wissen über Textzusammenhänge zur Korrektur beziehungsweise Rekonstruktion von Texten dienen können. Diese Methoden können in den verschiedensten Umgebungen eingesetzt werden. Projekte, die Herr Büchler vorstellte, umfassten die automatische Erfassung und von Werkstatt-Berichten bei einem großen Automobilherstellers (oft nur stichpunktartig, mit Rechtschreibfehlern), die Textvervollständigung alter griechischer Papyri aus dem Projekt <a title="eAQUA" href="http://www.eaqua.net/index.php">eAQUA</a> (häufige Fehlstellen, zusätzlich verschiedene Dialekte und Schreibvarianten), und die OCR-Korrektur von diplomatischen Texten aus den Beziehungen zwischen den USA und dem Iran (Herausforderung: islamische Personennamen).</p>
<p>Anschließend ging er genauer auf das eAQUA-Projekt ein. Die Papyri seien häufig beschädigt, Wortbestandteile oder ganze Wörter fehlten. Daher habe man Text-Mining-Werkzeuge entwickelt, die durch ihr Wissen über den gesamten Textkorpus der Papyri mögliche Ergänzungen mit einiger Genauigkeit vorhersagen könnten.</p>
<p>Die Hauptschwierigkeit für vergleichbare Projekte liege aber genau darin, gute Trainingsdaten für die Software zu finden. Bei der Korrektur von OCR sei zu überlegen, wie deren Fehler korrigiert werden könnten, ohne dabei auch im Original befindliche Rechtschreibfehler zu korrigieren, die für Geisteswissenschaftler von Interesse sein könnten.</p>
<p><span style="text-decoration:underline;">                                                                   </span></p>
<p>Marco Büchler of the Natural Language Processing Group at the University of Leipzig talked about text mining tools, and how they can be used to correct or reconstruct old texts. One of his examples was the <a href="http://www.eaqua.net/index.php">eAQUA</a> project, where methods were developed to reconstruct missing text passages in antique Greek papyri.</p>
<p>&nbsp;</p>
<p><em>VD; Mark-Oliver Fischer<br />
</em></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/mdzblog.wordpress.com/47/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/mdzblog.wordpress.com/47/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/mdzblog.wordpress.com/47/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/mdzblog.wordpress.com/47/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/mdzblog.wordpress.com/47/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/mdzblog.wordpress.com/47/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/mdzblog.wordpress.com/47/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/mdzblog.wordpress.com/47/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/mdzblog.wordpress.com/47/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/mdzblog.wordpress.com/47/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/mdzblog.wordpress.com/47/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/mdzblog.wordpress.com/47/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/mdzblog.wordpress.com/47/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/mdzblog.wordpress.com/47/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=47&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://mdzblog.wordpress.com/2011/10/12/textvervollstandigung-ocr-und-rechtschreibkorrektur-drei-sichten-auf-gleiche-methoden/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/581ab80a14f5c491e3e8d85564722aa4?s=96&#38;d=http%3A%2F%2F1.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D96&#38;r=PG" medium="image">
			<media:title type="html">mdzblog</media:title>
		</media:content>
	</item>
		<item>
		<title>Praxistest zweier OCR-Softwareprodukte am Beispiel ausgewählter Funeralschriftenbestände der SBB</title>
		<link>http://mdzblog.wordpress.com/2011/10/12/praxistest-zweier-ocr-softwareprodukte-am-beispiel-ausgewahlter-funeralschriftenbestande-der/</link>
		<comments>http://mdzblog.wordpress.com/2011/10/12/praxistest-zweier-ocr-softwareprodukte-am-beispiel-ausgewahlter-funeralschriftenbestande-der/#comments</comments>
		<pubDate>Wed, 12 Oct 2011 13:02:43 +0000</pubDate>
		<dc:creator>mdzblog</dc:creator>
				<category><![CDATA["Historische Dokumente" Okt. 2011]]></category>
		<category><![CDATA[Veranstaltungen]]></category>

		<guid isPermaLink="false">http://mdzblog.wordpress.com/?p=45</guid>
		<description><![CDATA[Maria Federbusch von der Staatsbibliothek zu Berlin &#8211; Preußischer Kulturbesitz sprach über einen von der DFG geförderten Praxistest zweier OCR-Softwareprodukte B.I.T. Alpha von B.I.T. Bureau Ingénieur Tomasi S.à.r.l. und HK-OCR (auf Basis der ABBYY FineReader Engine 9) von Herrmann &#38; Kraemer GmbH und &#8230; <a href="http://mdzblog.wordpress.com/2011/10/12/praxistest-zweier-ocr-softwareprodukte-am-beispiel-ausgewahlter-funeralschriftenbestande-der/">Weiterlesen <span class="meta-nav">&#8594;</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=45&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<div class='embed-vimeo' style='text-align:center;'><iframe src='http://player.vimeo.com/video/32266630' width='400' height='300' frameborder='0'></iframe></div>
<iframe src='http://www.slideshare.net/slideshow/embed_code/9695379' width='584' height='479'></iframe>
<p><em><br />
</em></p>
<p>Maria Federbusch von der Staatsbibliothek zu Berlin &#8211; Preußischer Kulturbesitz sprach über einen von der DFG geförderten <a title="SBB - Funeralschriften" href="http://staatsbibliothek-berlin.de/die-staatsbibliothek/abteilungen/historische-drucke/aufgaben-profil/projekte/funeralschriften/">Praxistest</a> zweier OCR-Softwareprodukte B.I.T. Alpha von B.I.T. Bureau Ingénieur Tomasi S.à.r.l. und HK-OCR (auf Basis der ABBYY <em>FineReader Engine</em> <em>9</em>) von Herrmann &amp; Kraemer GmbH und Co. KG, am Beispiel von je 25.000 Seiten aus Funeralschriften, das sind protestantische Leichenpredigten des 17. und 18. Jahrhunderts v.a. aus dem mitteldeutschen Raum. Sie stellte also eine Anwendersicht auf OCR-Produkte vor.</p>
<p>Eine Schwierigkeit stellte die Schriftenvielfalt dar: verschiedene Frakturschriften des 17. und 18. Jahrhunderts sowie Zitate in lateinischer, griechischer und hebräischer Schrift, z.T. Marginalien. Erleichternd für den Aufbau an den Bestand angepasster Wörterbücher wirkte sich der gattungsspezifische Wortschatz der Funeralschriften aus.</p>
<p>Verglichen wurden unter anderem Aspekte der Softwareinstallation, &#8211; dokumentation und der Bedienung, die Exportmöglichkeiten von Zwischen- und Endergebnissen, und die Qualität der Ergebnisse.</p>
<p>Die Referentin zeigte hier für beide Softwareprodukte zahlreiche Beispiele aus dem Projekt und fasste als Ergebnis zusammen, dass es Übereinstimmungen wie auch Unterschiede gab. Das Training von Musterdateien zahlte sich in beiden OCR-Umgebungen aus, auch der Einsatz von Wortbibliotheken wirkte sich grundsätzlich positiv auf die Ergebnisse aus. Es sei aber noch Raum für Weiterentwicklungen. Auf allgemeine Empfehlungen verzichtete die Referentin jedoch, da die Projektauswertung derzeit noch nicht abgeschlossen ist. Ein abschließender Bericht ist in Vorbereitung.</p>
<p><span style="text-decoration:underline;">                                                                                      </span></p>
<p>Maria Federbusch of the State Library of Berlin presented a <a title="SBB - Funeralschriften" href="http://staatsbibliothek-berlin.de/die-staatsbibliothek/abteilungen/historische-drucke/aufgaben-profil/projekte/funeralschriften/">pilot project</a> that compared two different OCR software solutions &#8211; B.I.T. Alpha by B.I.T. Bureau Ingénieur Tomasi S.à.r.l. and HK-OCR (based on ABBYY <em>FineReader Engine</em> <em>9</em>) by Herrmann &amp; Kraemer GmbH und Co. KG. Both tools were tasked with the recognition of 25.000 pages of funeral sermons from the 17th and 18th century. The project has ended, but the final report hasn&#8217;t been published yet.</p>
<p>&nbsp;</p>
<p><em>VD; Mark-Oliver Fischer<br />
</em></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/mdzblog.wordpress.com/45/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/mdzblog.wordpress.com/45/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/mdzblog.wordpress.com/45/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/mdzblog.wordpress.com/45/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/mdzblog.wordpress.com/45/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/mdzblog.wordpress.com/45/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/mdzblog.wordpress.com/45/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/mdzblog.wordpress.com/45/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/mdzblog.wordpress.com/45/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/mdzblog.wordpress.com/45/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/mdzblog.wordpress.com/45/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/mdzblog.wordpress.com/45/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/mdzblog.wordpress.com/45/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/mdzblog.wordpress.com/45/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=45&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://mdzblog.wordpress.com/2011/10/12/praxistest-zweier-ocr-softwareprodukte-am-beispiel-ausgewahlter-funeralschriftenbestande-der/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/581ab80a14f5c491e3e8d85564722aa4?s=96&#38;d=http%3A%2F%2F1.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D96&#38;r=PG" medium="image">
			<media:title type="html">mdzblog</media:title>
		</media:content>
	</item>
		<item>
		<title>OCR-Software</title>
		<link>http://mdzblog.wordpress.com/2011/10/12/ocr-software/</link>
		<comments>http://mdzblog.wordpress.com/2011/10/12/ocr-software/#comments</comments>
		<pubDate>Wed, 12 Oct 2011 12:31:26 +0000</pubDate>
		<dc:creator>mdzblog</dc:creator>
				<category><![CDATA["Historische Dokumente" Okt. 2011]]></category>
		<category><![CDATA[Veranstaltungen]]></category>

		<guid isPermaLink="false">http://mdzblog.wordpress.com/?p=43</guid>
		<description><![CDATA[&#160; Taomir Ebersold (ARPA Data GmbH) und Markus Pichler (ABBYY Europe GmbH) referierten jeweils über die in ihren Firmen entwickelte OCR-Software. Den Anfang machte Taomir Ebersold von ARPA mit der Vorstellung der Produktlinie „PaperIn“. PaperIn ist eine All-In-One-Lösung für alle &#8230; <a href="http://mdzblog.wordpress.com/2011/10/12/ocr-software/">Weiterlesen <span class="meta-nav">&#8594;</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=43&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></description>
			<content:encoded><![CDATA[<p><em><div class='embed-vimeo' style='text-align:center;'><iframe src='http://player.vimeo.com/video/32266449' width='400' height='300' frameborder='0'></iframe></div></em></p>
<p>&nbsp;</p>
<p>Taomir Ebersold (ARPA Data GmbH) und Markus Pichler (ABBYY Europe GmbH) referierten jeweils über die in ihren Firmen entwickelte OCR-Software.</p>
<iframe src='http://www.slideshare.net/slideshow/embed_code/9695203' width='584' height='479'></iframe>
<p>Den Anfang machte Taomir Ebersold von ARPA mit der Vorstellung der Produktlinie „Paper<em>In</em>“.</p>
<p>PaperIn ist eine All-In-One-Lösung für alle Arten von gedrucktem Material, die nicht nur reine Texterkennung bietet, sondern alle Schritte vom Scannen bis zur Bereitstellung im Internet umfasst. Mit „Paper<em>In</em>“ können beispielsweise projektbezogene Wörterbücher angelegt sowie manuelle Korrekturen am Text vorgenommen werden. Illustriert wurden die Einsatzmöglichkeiten anhand der PaperIn-Lösung für die „Allgemeinen Deutsche Biographie“ (das Projekt ADB ist ein Gemeinschaftsprojekt mit der Georg Olms Verlag AG und der ARPA Data GmbH), die auch übers Internet – nach einer Registrierung – als <a title="Demo" href="http://www.arpa-info.ch/index.php?page=784&amp;book_id=10">Demo</a> aufgerufen werden kann.</p>
<iframe src='http://www.slideshare.net/slideshow/embed_code/9695265' width='584' height='479'></iframe>
<p>Im zweiten Teil des Themenblocks referierte Markus Pichler über „OCR-Software – Automatisierte hochskalierbare OCR im Bibliotheksumfeld“ und stellte den ABBYY Recognition Server 3.0 vor.</p>
<p>Aufgrund der Skalierbarkeit und der Option, durchsuchbare PDFs auszugeben, eignet sich der Recognition Server besonders gut für Massendigitalisierungsprojekte im Bibliotheksumfeld. In den letzten Jahren wurde im Rahmen des Projekts IMPACT, an dem auch ABBYY beteiligt ist, der Fokus v.a. auf die Weiterentwicklung der OCR bei historischen Dokumenten gelegt. Im Bereich der Binarisierung und Layouterkennung konnte mit adaptiven Verfahren eine deutliche Verbesserung erzielt werden. Im Bereich der Texterkennung sind v.a. die verbesserte Erkennung von Frakturschriften und die Einbindung externer Wörterbücher zu nennen. Auch durch die Erweiterung der Exportformate auf ALTO und ePub ging man auf die Wünsche und Bedürfnisse der Bibliotheken ein. Abschließend erläuterte Herr Pichler die Möglichkeit der manuellen Verifizierung und Korrektur, die sowohl auf Text- als auch auf Layoutebene erfolgen kann.</p>
<p>&nbsp;</p>
<p><em>VD; Mark-Oliver Fischer<br />
</em></p>
<br />  <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gocomments/mdzblog.wordpress.com/43/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/comments/mdzblog.wordpress.com/43/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godelicious/mdzblog.wordpress.com/43/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/delicious/mdzblog.wordpress.com/43/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gofacebook/mdzblog.wordpress.com/43/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/facebook/mdzblog.wordpress.com/43/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gotwitter/mdzblog.wordpress.com/43/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/twitter/mdzblog.wordpress.com/43/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/gostumble/mdzblog.wordpress.com/43/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/stumble/mdzblog.wordpress.com/43/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/godigg/mdzblog.wordpress.com/43/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/digg/mdzblog.wordpress.com/43/" /></a> <a rel="nofollow" href="http://feeds.wordpress.com/1.0/goreddit/mdzblog.wordpress.com/43/"><img alt="" border="0" src="http://feeds.wordpress.com/1.0/reddit/mdzblog.wordpress.com/43/" /></a> <img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=mdzblog.wordpress.com&amp;blog=26709057&amp;post=43&amp;subd=mdzblog&amp;ref=&amp;feed=1" width="1" height="1" />]]></content:encoded>
			<wfw:commentRss>http://mdzblog.wordpress.com/2011/10/12/ocr-software/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
	
		<media:content url="http://1.gravatar.com/avatar/581ab80a14f5c491e3e8d85564722aa4?s=96&#38;d=http%3A%2F%2F1.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D96&#38;r=PG" medium="image">
			<media:title type="html">mdzblog</media:title>
		</media:content>
	</item>
	</channel>
</rss>
