Schnellnavigation

Steuerleiste | Navigation | Suche | Inhalt

Suche

Erweiterte Suche Tipps und Tricks

Alle Dokumente

Suchmaske und Trefferliste maximieren
 


Hinweis

Dokument

  in html speichern drucken pdf Dokument Ansicht maximierenDokumentansicht maximieren
Kurztext
Langtext
Gericht:Verwaltungsgerichtshof Baden-Württemberg 9. Senat
Entscheidungsdatum:10.11.2010
Aktenzeichen:9 S 591/10
ECLI:ECLI:DE:VGHBW:2010:1110.9S591.10.0A
Dokumenttyp:Urteil
Quelle:juris Logo
Normen:§ 2 Abs 1 JAG BW, § 3 Abs 1 JAG BW, § 14 JAPO BW vom 07.05.1993, § 15 JAPO BW vom 07.05.1993

(Juristische Staatsprüfung: Prüfungsmangel bei Verstoß gegen das Gebot der Chancengleichheit)

Leitsatz

1. Ein unangemessener Beurteilungsmaßstab kann wegen Verstoßes gegen das Gebot der Chancengleichheit zu einem Prüfungsmangel führen.(Rn.25)

2. Weicht bei einer landesweit einheitlichen Prüfung - hier Erste juristische Staatsprüfung - die Bestehensquote hinsichtlich eines Prüfungsortes signifikant von derjenigen anderer Prüfungsorte ab, so stellt dies für sich genommen keinen Verstoß gegen das Gebot der prüfungsrechtlichen Chancengleichheit dar. Erst wenn weitere Indizien für einen solchen Verstoß vorliegen, ist nach den Grundsätzen des Anscheinsbeweises die Prüfungsbehörde für die Einhaltung der Chancengleichheit beweispflichtig.(Rn.26)

3. Das Gebot der Sachlichkeit und inneren emotionalen Distanziertheit ist verletzt, wenn ein Prüfer zu erkennen gibt, dass er plausible Kritik an zahlreichen emotionalen, nicht allein sachbezogenen Äußerungen nicht als solche anzuerkennen in der Lage ist.(Rn.49)

4. Bei einer offenen Zweitbewertung, die eine Leistung abweichend von der Erstbewertung als "nicht bestanden" betrachtet, reicht es nicht aus, auf den eigenen - abweichenden - Erwartungshorizont zu verweisen, sondern die Gründe, aus denen die Leistung durchschnittlichen Anforderungen nicht mehr entspricht, sind inhaltlich darzulegen.(Rn.70)

Fundstellen ausblendenFundstellen

Abkürzung Fundstelle ESVGH 61, 191 (Leitsatz)
Abkürzung Fundstelle VBlBW 2011, 189-193 (Leitsatz und Gründe)
Abkürzung Fundstelle HRZ 4, Nr 1, 64-90 (2015) (Leitsatz und Gründe)

weitere Fundstellen einblendenweitere Fundstellen ...

Verfahrensgang ausblendenVerfahrensgang

vorgehend VG Stuttgart 12. Kammer, 12. August 2009, Az: 12 K 2406/08, Urteil
nachgehend BVerwG, 29. Juni 2011, Az: 6 B 7/11, Beschluss

Diese Entscheidung wird zitiert ausblendenDiese Entscheidung wird zitiert


Tenor

Das Urteil des Verwaltungsgerichts Stuttgart vom 12. August 2009 - 12 K 2406/08 - wird geändert und wie folgt neu gefasst:

Der Bescheid des Justizministeriums Baden-Württemberg - Landesjustizprüfungsamt - vom 19. Dezember 2007 und dessen Widerspruchsbescheid vom 20. Mai 2008 werden aufgehoben.

Der Beklagte wird verpflichtet, die vom Kläger im Rahmen des schriftlichen Teils der Ersten juristischen Staatsprüfung - Herbst 2007 - erbrachten Leistungen in der Aufsichtsarbeit Nummer 5 durch einen neuen Erstprüfer und den bisherigen Zweitprüfer und in der Aufsichtsarbeit Nummer 6 durch den bisherigen Zweitprüfer unter Beachtung der Rechtsauffassung des Gerichts neu zu bewerten und das Prüfungsverfahren fortzusetzen.

Im Übrigen wird die Klage abgewiesen.

Von den Kosten des Verfahrens in beiden Rechtszügen tragen Kläger und Beklagter jeweils die Hälfte.

Die Revision wird nicht zugelassen.

Tatbestand

1

Der Kläger begehrt die Neubewertung der von ihm im Rahmen der Ersten juristischen Staatsprüfung - Herbst 2007 - geschriebenen Klausuren Nummer 2, 4, 5 und 6 mit dem Ziel, zur mündlichen Prüfung zugelassen zu werden.

2

Der im September 1976 geborene Kläger begann im Herbst 1998 sein Studium der Rechtswissenschaft an der Universität Konstanz. Nach vergeblichen Versuchen im Herbst 2002 (sog. „Freiversuch“) und im Frühjahr 2005 (Prüfungsort jeweils Konstanz) nahm er im Herbst 2007 zum dritten Mal am schriftlichen Teil der Ersten juristischen Staatsprüfung zu den Bedingungen der JAPrO 1993 teil. Prüfungsort war auf seinen ausdrücklichen Wunsch hin Mannheim wegen dessen leichterer Erreichbarkeit von seinem aktuellen Wohnort Berlin. Seine Leistungen wurden mit einer Gesamtdurchschnittszahl von 3,78 Punkten und im Einzelnen wie folgt bewertet:

3
        

Zivilrecht

Strafrecht

Öffentl. Recht

Aufsichtsarbeit            

1

2

3

4

5

6

7

Erstprüfer

8,0  

4,0  

3,0  

2,0  

3,0  

4,0  

3,0

Zweitprüfer

8,0

3,0

3,0

3,0

3,0

3,0

3,0

Durchschnitt            

8,0

3,5

3,0

2,5

3,0

3,5

3,0

4

Mit Bescheid vom 19.12.2007 teilte ihm der Beklagte mit, er werde zur mündlichen Prüfung nicht zugelassen, da nicht wenigstens drei der schriftlichen Arbeiten mit im Durchschnitt jeweils 4,0 Punkten bewertet worden seien. Damit habe er die Erste juristische Staatsprüfung endgültig nicht bestanden.

5

Mit seinem Widerspruch erhob der Kläger Einwände gegen die Bewertung der Aufsichtsarbeiten Nummer 2, 4, 5 und 6 durch jeweils beide Gutachter.

6

Da die Gutachter in ihren vom Beklagten eingeholten Stellungnahmen an ihren Bewertungen festhielten, wies der Beklagte den Widerspruch mit Bescheid vom 20.05.2008 zurück. Es seien weder Rechts- noch Bewertungsfehler erkennbar

7

Auf seine Klage vom 19.06.2008 verpflichtete das Verwaltungsgericht Stuttgart den Beklagten unter Aufhebung der Bescheide vom 19.12.2007 und vom 20.05.2008 durch Urteil vom 12.08.2009 dazu, die Prüfungsleistungen des Klägers unter Beachtung der Rechtsauffassung des Gerichts neu bewerten zu lassen und das Prüfungsverfahren fortzusetzen.

8

Aus den Gründen des Urteils ergibt sich, dass sich diese Verpflichtung zur Neubewertung nur auf die vom Kläger angegriffenen Aufsichtsarbeiten Nummer 2, 4, 5 und 6 und zugleich auf die bereits als Gutachter tätig gewesenen Personen bezieht. Die Gutachter hätten ihre Bewertungen auch daraufhin zu überprüfen, ob der von ihnen angelegte Bewertungsmaßstab zu streng sei. Aus der im Vergleich zu den anderen Prüfungsorten deutlich höheren Durchfallquote ergebe sich ein Prüfungsmangel, der bereits für sich genommen zu einem Anspruch auf Neubewertung der Aufsichtsarbeiten 2, 4, 5 und 6 führe. Ein anderer Grund für diese signifikante Abweichung (Durchfallquote Mannheim: 58,33%, in anderen Städten zwischen 35,90% - Tübingen - und 39,04% - Konstanz -) komme nicht ernsthaft in Betracht. Für eine gegenüber dem Durchschnitt des Landes deutlich geringere Qualifikation der Prüflinge in Mannheim gebe es keine Anhaltspunkte. Also müssten „einzelne oder alle Prüfer“ in Mannheim einen wesentlich strengeren - und damit zu strengen - Prüfungsmaßstab angelegt und die Kandidaten „heruntergeprüft“ haben. Entsprechende Äußerungen von Prüfern seien gerichtsbekannt geworden. Unterschiedliche Prüfungsmaßstäbe stellten einen Verstoß gegen die Chancengleichheit dar. Diesem zu strengen Prüfungsmaßstab sei auch der Kläger unterworfen gewesen und daher in seinen subjektiven Rechten verletzt, auch wenn die Anwendung eines zu strengen Prüfungsmaßstabes nicht einzelnen Prüfern zugeordnet werden könne und den Prüfern ein prüfungsspezifischer Wertungsspielraum zustehe. Darüber hinaus dringe der Kläger auch mit einem Teil seiner gegen die angefochtenen Bewertungen der genannten Aufsichtsarbeiten erhobenen Einwendungen mit der Folge durch, dass die Neubewertungen zusätzlich unter Beachtung weiterer, im einzelnen vom Gericht dargelegter Maßgaben zu erfolgen habe.

9

Dagegen richtet sich die vom Verwaltungsgerichtshof zugelassene Berufung des Beklagten. Er beantragt,

10

das Urteil des Verwaltungsgerichts Stuttgart vom 12.08.2009 - 12 K 2406/08 - zu ändern und die Klage abzuweisen.

11

Zur Begründung trägt er insbesondere vor, ein strenger, aber bewertungsfehlerfreier Maßstab stelle keinen Prüfungsmangel dar, auch könne nicht präzise zwischen einem angemessenen und einem zu strengen Prüfungsmaßstab unterschieden werden. Der Anspruch des Prüflings richte sich allein darauf, bewertungsfehlerfrei beurteilt zu werden. Dies zeige sich etwa darin, dass das Angleichungsverfahren nach § 13 Abs. 2 Satz 1 JAPrO 1993 erst bei einer Abweichung um mehr als vier Punkte zur Anwendung komme. Das Recht von Prüflingen auf Chancengleichheit sei schon dadurch ausreichend gewährleistet, dass eine Mehrheit von Prüfern tätig würde, wodurch sich strenge und weniger strenge Bewertungen weitgehend ausglichen. Der Vorwurf des bewertungsfehlerhaften „Herunterprüfens“ müsse einem oder mehreren bestimmten Prüfern eindeutig individuell zugeordnet werden können. Die Prüfer aus dem Kreise der Praktiker würden nicht nur an einem Prüfungsort, sondern landesweit eingesetzt. In der Prüfungskampagne Herbst 2007 habe der Anteil der Hochschullehrer lediglich ca. 25% betragen. Im Übrigen kämen selbst dann, wenn der Schluss von einer hohen Durchfallquote auf einen Bewertungsmangel zulässig wäre, auch andere Erklärungen ernsthaft in Betracht: Unterschiedlicher Lehrerfolg in Abhängigkeit von Studienorganisation und Lehrqualität an den jeweiligen Universitäten mit der Folge regelmäßig überdurchschnittlicher Ergebnisse in Freiburg und Heidelberg; unterschiedliche Zahl und damit auch Qualität der Repetitorienangebote je Studienort; enge Korrelation zwischen Abiturnote und Studienerfolg gerade im Fach Rechtswissenschaften, wobei der Abiturdurchschnitt in Mannheim wegen der geringeren Attraktivität der dortigen Universität gegenüber anderen Prüfungsorten abfallen dürfte. Möglicherweise hätte sich auch die Zusammensetzung der Prüflinge gerade in dieser Kampagne, der letzten nach den Maßstäben der JAPrO 1993, an den verschiedenen Studienorten signifikant unterschieden. So habe etwa die Quote der „echten“ Wiederholer, für die der erste Versuch kein Freiversuch gewesen sei, in Mannheim zwischen knapp 14% und ca. 27% höher gelegen als an den anderen Studienorten. Auch die Studiendauer sei bei der Kampagne Herbst 2007 in Mannheim am längsten gewesen. Zudem ergebe sich aus der unterschiedlichen Durchfallquote nicht zwingend eine statistische Auffälligkeit. In Anbetracht der vorliegenden Informationen könne es sich auch „um eine statistisch nicht signifikante natürliche Schwankung innerhalb der Standardabweichung“ handeln. Für eine entsprechende Feststellung sei auch die Zahl der Prüfer von Bedeutung, die in Mannheim an der Korrektur einer einzelnen Aufsichtsarbeit beteiligt gewesen seien.

12

Weiter seien aus den im einzelnen dargelegten Gründen die Bewertungen der Klausuren 2, 4, 5 und 6 entgegen der Begründung des Urteils frei von Bewertungsfehlern.

13

Der Kläger beantragt,

14

die Berufung zurückzuweisen.

15

Er trägt im Wesentlichen vor, zu Recht habe das Verwaltungsgericht den Beklagten zur erneuten Bewertung der Klausuren 2, 4, 5 und 6 verpflichtet. Das Gericht habe einen zu strengen Bewertungsmaßstab zu Recht moniert, auch wenn hinsichtlich der Zuordnung zu einzelnen Prüfern letzte Gewissheit nicht zu erzielen sei. Dies liege in der Natur des Beweisrechts und dessen Grenzen insbesondere da, wo es um innere, einem Beweis nicht zugängliche Umstände gehe. Dass sich ein erwiesener Bewertungsfehler nicht eindeutig auf seine Urheber zurückführen lasse, könne nicht dazu führen, seine Existenz selbst in Frage zu stellen. Das Verwaltungsgericht habe auch nicht allein aus der - signifikant hohen - Durchfallquote auf einen Bewertungsmangel geschlossen, sondern auch andere Aspekte berücksichtigt. Gestützt werde die Feststellung dieses Bewertungsmangels zusätzlich durch den Umstand, dass - anders als an den anderen Universitätsstandorten - die „Notenverbesserer“ in Mannheim kaum zu einer Steigerung der Erfolgsquote hätten beitragen können. Würden diese herausgerechnet, stiegen die Durchfallquoten in Heidelberg um 8,02 Prozentpunkte, in Konstanz um 8,27 Prozentpunkte, in Mannheim jedoch nur um 3,21 Prozentpunkte. Dagegen dürften individuelle Determinanten einer Prüfungsleistung wie Motivation, Durchhaltevermögen und psychische Belastbarkeit gegenüber kognitiven Faktoren wie allgemeiner Intelligenz und prüfungsspezifischem Wissen, wie sie sich in der Abiturnote niederschlügen, nicht zu gering geachtet werden. Hinzu komme, dass zum Examen überhaupt nur antrete, wer das Studium ernsthaft zu Ende führen wolle. Auch auf ein besonderes Engagement der Lehre könne es nicht ankommen, denn es könne bei lebensnaher Betrachtung nicht davon ausgegangen werden, dass die Lehre in Mannheim besonders schwach sei.

16

Im Übrigen träfen sämtliche neben dem gerichtlich festgestellten Bewertungsmangel vom Beklagten angeführten möglichen Erklärungsversuche für die festzustellende Durchfallquote in Mannheim auf ihn nicht zu: Er habe weder in Mannheim studiert noch dort ein Repetitorium besucht, sondern sich in beiderlei Hinsicht in Konstanz auf die Prüfung vorbereitet. Zudem liege sein Abiturnotendurchschnitt im Bereich des „gut“, so dass er nicht zu der vom Scheitern bedrohten Personengruppe gehöre.

17

Hinsichtlich der von ihm angegriffenen Bewertung der Klausuren 2, 4, 5 und 6 verteidigt der Kläger die einzelnen, zu deren Neubewertung verpflichtenden Angaben des Gerichts.

18

Der Beklagte hat auf Anforderung des Senats Übersichten über die Prüfertätigkeit der „Praktikerprüfer“ an den verschiedenen Prüfungsorten sowie über die Ergebnisse der Ersten juristischen Staatsprüfung - Herbst 2007 - nach Maßgabe der JAPrO 1993 und aufgeteilt auf die verschiedenen Prüfungsorte vorgelegt. In der mündlichen Verhandlung hat der Beklagte noch eine Übersicht über die Ergebnisse auch der Kandidaten vorgelegt, die nach der neuen JAPrO 2002 geprüft wurden, und darauf hingewiesen, dass diese Kandidaten - abgesehen von der Klausur Nummer 5 - dieselben Klausuren geschrieben hätten wie die übrigen Kandidaten. In den Korrekturpaketen der Korrektoren hätten sich Arbeiten beider Kandidatengruppen befunden, ohne dass die Zugehörigkeit der Verfasser zur jeweiligen Gruppe zu erkennen gewesen sei. Unter den nach JAPrO 2002 zu beurteilenden Kandidaten hätten die Prüflinge am Prüfungsort Mannheim mit Abstand ab besten abgeschnitten. Weiter hat der Beklagte einen Bericht über ein Forschungsprojekt „Ermittlung von Prädiktoren für den erfolgreichen Studienabschluss im Fachbereich Rechtswissenschaft: Eine retrospektive Datenanalyse“, gefertigt an der Universität Konstanz im Jahr 2005, vorgelegt. Hierauf, auf die beigezogenen Behördenakte des Beklagten sowie die Gerichtsakten des Verwaltungsgerichts und des erkennenden Senats wird hinsichtlich weiterer Einzelheiten des Sach- und Streitstandes Bezug genommen.

Entscheidungsgründe

19

Die vom Verwaltungsgerichtshof zugelassene und ordnungsgemäß erhobene sowie fristgerecht begründete Berufung des Beklagten hat teilweise Erfolg. Die zulässige Klage ist entgegen dem durch die Berufung angegriffenen Urteil des Verwaltungsgerichts nicht hinsichtlich der Bewertung sämtlicher vom Kläger angegriffener Klausuren sondern nur insoweit begründet, als die Korrektur der Klausur Nr. 5 durch beide Prüfer und die Korrektur der Klausur Nr. 6 durch den Zweitprüfer angegriffen worden ist. Dabei ergibt sich die Begründetheit der Klage aus der Analyse der einzelnen Korrekturen (s. dazu unter 2.). Nicht begründet ist die Klage, insoweit sie einen generellen Prüfungsmangel wegen eines am Prüfungsort Mannheim festzustellenden gleichheitswidrig strengen Prüfungsmaßstabes behauptet (s. dazu unter 1.).

20

Auf den vorliegenden Rechtsstreit findet die Verordnung des Justizministeriums über die Ausbildung und Prüfung der Juristen in der Fassung vom 07.05.1993 (letzte Änderung 25.09.2000, GBl. S. 665, - JAPrO 1993 -) Anwendung, da der Kläger sein Studium im Wintersemester 1998/99 begann und im Herbst 2002 erstmals an der Ersten juristischen Staatsprüfung teilnahm (§ 62 Abs. 1 JAPrO i.d.F. vom 08.10.2002, GBl. S. 391, mit späteren Änderungen). Nach § 15 JAPrO 1993 ist der Kandidat von der mündlichen Prüfung ausgeschlossen und hat die Prüfung nicht bestanden, wenn er u.a. nicht in wenigstens drei Aufsichtsarbeiten vier oder mehr Punkte erreicht hat. Dies ist hier der Fall, da der Kläger lediglich in der Klausur Nr. 1 im Zivilrecht vier oder mehr Punkte erreicht hat.

21

1. Entgegen der Ansicht des Klägers und des Verwaltungsgerichts kann der Senat keinen Verstoß gegen den Grundsatz der Chancengleichheit in der Form feststellen, dass die Kandidaten, die ihre Klausuren am Prüfungsort Mannheim geschrieben haben, gegenüber denjenigen, die ihre Prüfung in Freiburg, Heidelberg, Konstanz oder Tübingen abgelegt haben, gleichheitswidrig benachteiligt worden sind.

22

Nach dem Grundsatz der Chancengleichheit müssen für vergleichbare Prüflinge soweit wie möglich vergleichbare Prüfungsbedingungen und Bewertungskriterien gelten (BVerfG, Beschluss vom 17.04.1991 - 1 BvR 419/81 u.a. BVerfGE 84, 34 [52-55]). Unstreitig sind an allen Prüfungsorten die gleichen Aufgaben gestellt worden. Dass unterschiedliche Prüfungsbedingungen vorgelegen haben, wird weder vorgetragen noch ist dies ersichtlich, und auch die bei der Bewertung der einzelnen Prüfungsleistungen geltenden Notenstufen bzw. Punktzahlen (§ 14 JAPrO 1993) sind identisch. Dass die Bewertungskriterien an den einzelnen Prüfungsorten unterschiedlich gehandhabt worden sind, kann der Senat nicht feststellen.

23

Das Verwaltungsgericht glaubt, unterschiedliche, den Grundsatz der Chancengleichheit verletzende Bewertungsmaßstäbe aufgrund der Tatsache annehmen zu können, dass die Durchfallquote in Mannheim höher ist als an anderen Prüfungsstandorten und gute Noten nicht oder kaum vergeben werden, ohne dass nachzuweisen sei, dass hierfür besondere Umstände in Bezug auf den Prüfungsort Mannheim vorlägen. Diese Umstände tragen den vom Verwaltungsgericht gezogenen Schluss nicht.

24

Zunächst ist darauf hinzuweisen, dass als Maßstab für die verwaltungsgerichtliche Kontrolle eines Prüfungsergebnisses, das auf der individuellen Ermittlung von Leistungen des Prüflings durch mehrere Prüfer beruht, nicht in Betracht kommt, ob und inwieweit die Bewertungen der einzelnen Prüfer von statistischen Durchschnittswerten abweichen (vgl. BVerwG, Beschluss vom 11.08.1998 - 6 B 49/98 -, DVBl. 1998, 1351 [1352]). Statistische Unterschiede in der Notenvergabe bzw. der Durchfallquote an verschiedenen Prüfungsorten, die zugleich Studienorte sein können, aber nicht sein müssen, stellen für sich genommen keinen hinreichenden Anknüpfungspunkt für die Annahme eines Chancengleichheitsverstoßes dar.

25

Allerdings kann ein Prüfungsmangel darin liegen, dass unangemessene Anforderungen an die Prüflinge und die von ihnen zu erbringenden Leistungen gestellt werden. Nicht prinzipiell auszuschließen ist, dass ein solch unangemessener Prüfungsmaßstab nur von einigen Prüfern, etwa denen eines bestimmten Prüfungsabschnitts (also z.B. einer bestimmten Klausur) angelegt wird. Entsprechendes wäre auch für die Prüfer an einem bestimmten Prüfungsort denkbar.

26

In allen diesen Fällen wäre jedoch schon für die Annahme des Anscheins eines hieraus resultierenden Prüfungsmangels erforderlich, dass eine Reihe von Indizien auf einen solchen Verstoß gegen das Gebot der Chancengleichheit hinweist. Die bloße Feststellung, dass in einer bestimmten Prüfung die Ergebnisse - einschließlich der Durchfallquote (vgl. dazu Senatsbeschluss vom 08.11.2002 - 9 S 2361/02 -, NVwZ-RR 2003, 214 f.) - an einem bestimmten Prüfungsort signifikant schlechter sind als an anderen Prüfungsorten bzw. landesweit, reicht hierfür nicht aus. Erst dann, wenn eine solche Feststellung durch weitere Hinweise gestützt und auch nicht durch entgegenstehende Umstände entkräftet ist, kann - bis zum dann der prüfenden Institution obliegenden Beweis des Gegenteils - von einem Prüfungsmangel ausgegangen werden.

27

Im vorliegenden Fall führt eine Betrachtung der verschiedenen hier zu beachtenden Gesichtspunkte dazu, dass ein Anschein für das Vorliegen des Prüfungsmangels eines unangemessenen Prüfungsmaßstabes am Prüfungsort Mannheim nicht angenommen werden kann.

28

Zwar ergibt sich aus der von dem Beklagten mit Schriftsatz vom 26.10.2010 vorgelegten Statistik, dass die Durchfallquote aller nach der JAPrO 1993 geprüften Kandidaten in Mannheim 58,33 % betragen hat, während in Freiburg 36,42 %, in Heidelberg 36,17 %, in Konstanz 39,04 % und in Tübingen 35,90 % die Prüfung nicht bestanden haben. Demnach war die Durchfallquote in Mannheim deutlich höher als an den anderen Prüfungsorten und damit auch als im Landesdurchschnitt. Dies gilt auch, wenn dabei die so genannten „Notenverbesserer“ unberücksichtigt bleiben.

29

Dieses Bild verändert sich jedoch deutlich, wenn alleine die Wiederholer betrachtet werden, die bei der im Herbst 2007 letztmals eröffneten Möglichkeit, nach der - alten - JAPrO 1993 geprüft zu werden, ein besonderes Gewicht haben. Zunächst fällt auf, dass die Quote an Wiederholern in Mannheim mit 93,85% aller derjenigen, die die Prüfung bisher noch nicht bestanden haben - also ohne die „Notenverbesserer“ -, bzw. mit 63,54% aller Teilnehmer (einschließlich der Notenverbesserer) deutlich höher war als an anderen Studienorten (Wiederholer ohne Notenverbesserer: zwischen 56,99% in Konstanz und 85,71% in Freiburg, Landesdurchschnitt: 76,23%; Wiederholer absolut: zwischen 36,30% in Konstanz und 49,65% in Heidelberg, Landesdurchschnitt: 45,27%). Dies führte dazu, dass in Mannheim zwar die deutlich geringste Zahl an Prüflingen teilnahm (Mannheim: 96, Heidelberg 141, Konstanz 146, Freiburg 173, Tübingen 195), jedoch die Zahl der Wiederholer in Mannheim absolut höher war als in Konstanz (Mannheim: 61, Konstanz: 53) und die Abstände zu den übrigen Prüfungsorten sowohl absolut als auch relativ abnahm (Heidelberg 70 oder nur 15% mehr als in Mannheim; Freiburg 72 oder nur 18% mehr als in Mannheim und Tübingen 84 oder nur 38% mehr als in Mannheim). Zwar war auch bezogen allein auf die Wiederholer - die Zahl der Erstteilnehmer war in Mannheim mit 4 so niedrig, dass sich aus ihr nichts ableiten lässt - die Durchfallquote in Mannheim mit 62,30% um 9,95% höher als im Landesdurchschnitt, sie war aber immer noch - geringfügig - besser als in Konstanz mit 64,15%. Da Konstanz mit einer Gesamtdurchfallquote von 39,04% deutlich besser als Mannheim und nur geringfügig schlechter als die übrigen Studienorte abschnitt, müsste aus diesen Zahlen zum Beleg für einen unangemessenen Prüfungsmaßstab geschlossen werden, dass dieser Prüfungsmaßstab - bezogen auf sämtliche Prüfungsteilnehmer - allein in Mannheim, bezogen aber allein auf die Wiederholer - und nur auf sie - auch in Konstanz unangemessen gewesen sei. Da die Prüfer nicht erkennen können, ob es sich beim Bearbeiter einer Klausur um einen Wiederholer oder einen sonstigen Teilnehmer handelt, die Klausurenpakete nach den zufällig den Kandidaten zugeteilten Nummern zusammengestellt werden und in Konstanz also nur ein einheitlicher Prüfungsmaßstab angenommen werden kann, ist diese Aussage in sich widersprüchlich und daher nicht möglich. Schon dies spricht gegen den Anschein eines besonderen und damit die Chancengleichheit verletzenden Prüfungsmaßstabes in Mannheim.

30

Näher liegt deshalb der Schluss, dass der besonders hohe Anteil an Erstteilnehmern in Konstanz die Schwäche der Wiederholer ausgleicht und deshalb zwar die Wiederholer in Mannheim und in Konstanz gleichermaßen schwach sind, aber sich dennoch die Durchfallquote aller in Konstanz im Bereich des Durchschnitts bewegt.

31

Darüber hinaus sprechen weitere Aspekte gegen die Annahme eines Prüfungsmangels in Mannheim: Zum einen ist festzustellen, dass von den acht Korrektoren, deren Bewertung der Kläger angegriffen hat, sechs und damit drei Viertel so genannte Praktiker sind, die keine besondere Beziehung zu Mannheim und insbesondere zur dortigen Hochschule haben. Diese Prüfer wurden mit einer Ausnahme nicht nur in Mannheim, sondern zu anderen Terminen auch an anderen Prüfungsorten zur Bewertung schriftlicher Prüfungsleistungen eingesetzt. Es ist daher nicht vorstellbar, dass diese Prüfer in Mannheim einen anderen Prüfungsmaßstab ansetzten als anderswo. Außerdem hat sich im Parallelverfahren vor dem Senat ergeben, dass die dort behaupteten Prüferbesprechungen im Vorfeld der Korrekturen jedenfalls für die Erste juristische Staatsprüfung nicht belegt sind.

32

Zum anderen trägt auch das vom Verwaltungsgericht genannte Indiz nicht, dass gerade im Prädikatsbereich die Noten in Mannheim deutlich schlechter seien. Vielmehr lagen die Mannheimer Ergebnisse der Ersten juristischen Staatsprüfung vom Herbst 2007 derjenigen Kandidaten, die sich nach der JAPrO 2002 der Prüfung unterzogen haben und die - mit Ausnahme der Klausur Nr. 5 - die gleichen Arbeiten fertigen mussten, deutlich über dem Durchschnitt, obwohl ihre Leistungen von denselben Prüfern ohne erkennbare Differenzierung im „Gesamtpaket“ bewertet wurden. Auch wenn es sich bei der vom Beklagten vorgelegten Liste um Endergebnisse und nicht um die Ergebnisse allein der schriftlichen Prüfung handelt, so ist nicht anzunehmen, dass die überdurchschnittlichen Noten in Mannheim (im Prädikatsbereich ab vollbefriedigend über 54% gegenüber im Durchschnitt des Landes 22,4%, in Tübingen nur 14,6%; keiner der 22 Prüflinge in Mannheim hat nicht bestanden) allein auf den mündlichen Teil der Prüfung zurückzuführen sind.

33

Schließlich lässt auch die Behauptung, die Ergebnisse in Mannheim seien „regelmäßig“ schlechter als an anderen Prüfungsorten, gerade für den konkreten Prüfungszeitraum keinen weiterführenden Schluss zu. Dies ergibt sich bereits aus der Besonderheit dieses Prüfungstermins, den alle diejenigen Kandidaten wahrnehmen mussten, die ihre letzte Chance auf Durchführung der Prüfung nach der endgültig auslaufenden JAPrO 1993 noch nutzen wollten. Diese Konstellation mit einem entsprechend hohen Anteil an Wiederholern - und auch einem in Mannheim höheren Anteil an Kandidaten höherer Semester als an anderen Studienorten - lässt bereits einen Vergleich mit „normalen“ Prüfungsterminen nicht zu. Im Übrigen ist weder in der angefochtenen Entscheidung noch vom Kläger dargelegt, woraus das Verwaltungsgericht den Schluss zieht, eine „regelmäßige“ Abweichung der Mannheimer Prüfungsergebnisse „nach unten“ sei „gerichtsbekannt“.

34

Nach alledem kann für die Prüfungskampagne Herbst 2007 ein Verstoß gegen das Gebot der Chancengleichheit wegen allgemeiner Anwendung eines ungerechtfertigt strengen Bewertungsmaßstabes in Mannheim nicht angenommen werden.

35

2. Hinsichtlich der einzelnen vom Kläger angegriffenen Klausuren hat die Berufung insoweit Erfolg, als die Bewertungen der Aufsichtsarbeiten Nummer 2 (dazu unter a) und Nummer 4 (dazu unter b) nicht als mängelbehaftet anzusehen sind. Fehlerhaft erscheinen lediglich die Bewertungen der Aufsichtsarbeiten Nummer 5 (dazu unter c) und Nummer 6 (dazu unter d).

36

Soweit die inhaltliche Überprüfung der Ausführungen des Klägers in Rede steht, ist dabei seit dem bereits genannten Beschluss des Bundesverfassungsgerichts vom 17.04.1991 davon auszugehen, dass zutreffende Antworten und brauchbare Lösungen im Prinzip nicht als falsch bewertet werden und zum Nichtbestehen führen dürfen. Auch eine vertretbare und mit gewichtigen Argumenten folgerichtig begründete Lösung darf nicht als falsch bewertet werden, und eine willkürliche Fehleinschätzung durch einen Prüfer liegt nicht erst dann vor, wenn sich dessen Annahme als gänzlich unhaltbar „aufdrängt“, sondern ist schon dann anzunehmen, wenn sie Fachkundigen als unhaltbar erscheint (BVerfGE 84, 34 [55]).

37

a) Das Verwaltungsgericht nimmt an, der Erstprüfer der Klausur Nummer 2 habe die Prüfung des § 119 Abs. 2 BGB zu Unrecht beanstandet. Dies trifft nicht zu. Vielmehr begegnet die Beurteilung des Erstprüfers keinen Bedenken und ist auch frei von einem Verstoß gegen Denkgesetze. Daher kann offen bleiben, ob die Bewertung der Prüfung einer bestimmten Norm als „fernliegend“ und einer bestimmten Prüfungsreihenfolge als „schwerfällig“ noch als vom Beurteilungsspielraum des Prüfers umfasst oder ob auch solche Bewertungen einer Unterscheidung nach „richtig“ oder „falsch“ zugänglich und daher gerichtlich uneingeschränkt überprüfbar sind.

38

Laut Sachverhalt dieser Arbeit liegt im Zusammenhang mit einem Kreditbegehren eine Täuschung über die tatsächliche Auftragslage vor. Unabhängig davon, ob diese Täuschung als Täuschung über die Kreditwürdigkeit einer Person anzusehen ist und ob - was zutrifft - die Kreditwürdigkeit als „Eigenschaft“ im Sinne des § 119 Abs. 2 BGB anzusehen sein kann, liegt es inhaltlich wie insbesondere aus systematischen Gründen jedenfalls näher, die mögliche Anfechtung einer Willenserklärung vorrangig anhand des § 123 BGB und nicht anhand des § 119 Abs. 2 BGB zu prüfen. Wichtiger als die Abfolge der Paragraphen ist nämlich, dass § 123 BGB die weitergehende Norm ist, wie sich aus der Bezugnahme des § 122 BGB allein auf §§ 119 und 120 BGB und nicht auf § 123 BGB und aus einem Vergleich des § 124 Abs. 1 BGB mit § 121 Abs. 1 Satz 1 BGB hinsichtlich der Anfechtungsfrist ergibt. Vor diesem Hintergrund ist in einer Bewertung der Bearbeitung dieser Frage durch den Kläger als „fernliegend“ und „schwerfällig“ ein Mangel nicht zu erkennen.

39

Die Gewichtung dieses Punktes in ihrer Bedeutung für die Endnote lässt auch einen Verstoß gegen Denkgesetze nicht erkennen. Zentral für diese Endnote sind die vom Erstprüfer festgestellten - und näher bezeichneten - „erheblichen Lücken und Fehler“. Es wird bereits aus dem Erstgutachten deutlich, dass hierzu eine „etwas schwerfällig“ ausfallende Prüfung eines „nicht ernsthaft in Betracht kommenden Anfechtungstatbestandes“ nicht gehört. Daher ist gut nachvollziehbar, dass der Erstprüfer im „Bedenkensverfahren“ ausführt, dieser Punkt habe auf das Ergebnis der Bewertung keinen Einfluss gehabt. Vielmehr wird plausibel dargelegt, dass auch eine unmittelbare Prüfung des § 123 Abs. 1 BGB zu keiner besseren Bewertung als „(noch) vier Punkte“ geführt hätte. Dies ist nicht zu beanstanden.

40

Ebenfalls nicht zu beanstanden ist der Umgang des Erstprüfers wie des Zweitprüfers mit dem von beiden festgestellten - erhöhten - Schwierigkeitsgrad dieser Klausur. Indem der Erstprüfer diese Klausur als „anspruchsvoll“ ansieht, gibt er seine Bereitschaft, dies bei der Bewertung zu berücksichtigen, bereits deutlich zu erkennen. Die Gewichtung einer Klausur hinsichtlich ihres Schwierigkeitsgrades ist Kern der prüfungsspezifischen Wertung und damit des nur eingeschränkt überprüfbaren Beurteilungsspielraumes (vgl. BVerfG, Beschluss vom 17.04.1991 - 1 BvR 1529/84 u.a. -, BVerfGE 84, 59 [79 f.]). Dieser wäre vorliegend nur bei Verkennung der normativ vorgegebenen Maßstäbe verletzt, etwa bei einer der Definition der Notenstufe „ausreichend“ widersprechenden Annahme, die Vergabe von vier Punkten setze das Erkennen sämtlicher im Fall angelegter Probleme voraus. Davon kann aber keine Rede sein. Der Erstprüfer hat vielmehr ungeachtet einer „Vielzahl an Fehlern und Lücken“ vier Punkte und der Zweitprüfer deshalb drei Punkte vergeben, weil für eine bessere Bewertung nach seinem Verständnis die „im Erstgutachten dargestellten Lücken und Mängel“ deutlich zu schwer wogen.

41

Hinsichtlich dessen Bewertung ist auch kein Widerspruch darin zu erkennen, dass er das in der Falllösung Vorhandene als „auf eher Banales“ beschränkt ansieht und hierzu feststellt, es trage „zur Lösung der Probleme des Falles“ kaum bei. Gerade wenn das tatsächlich Geprüfte inhaltlich „banal“ sein sollte, ist es nur logisch, dass es, eben weil die eigentlichen Probleme des Falles nicht erfasst sind, zu deren Lösung “kaum beiträgt“.

42

Die Korrekturen der Klausur Nummer 2 sind daher von Bewertungsmängeln frei.

43

b) Auch hinsichtlich der Bewertung der Bearbeitung von Klausur Nummer 4 liegen entgegen dem Ergebnis der Feststellungen des Verwaltungsgerichts keine Mängel vor. Bereits das Verwaltungsgericht hat im Detail allein den Umgang der Prüfer mit den Ausführungen des Klägers zu den Konkurrenzen bemängelt und die Bewertung im Übrigen bestätigt. Dies hat der Kläger im Berufungsverfahren nicht angegriffen. Insoweit wird auf die zutreffenden Ausführungen des Verwaltungsgerichts auf den Seiten 12 bis 14 seines Urteils verwiesen.

44

Hinsichtlich der Ausführungen des Klägers zu den Konkurrenzen auf den Seiten 8 und 9 seiner Bearbeitung ist das Verwaltungsgericht der Auffassung, eine fehlerhafte Bewertung mit Einfluss auf das Beurteilungsergebnis sei nicht auszuschließen. Abgesehen davon, dass für den Erfolg der Klage die bloße Möglichkeit eines Bewertungsfehlers nicht ausreicht, ist die Randbemerkung des Erstprüfers auf S. 9 zum Konkurrenzverhältnis des gefährlichen Eingriffs in den Straßenverkehr zum versuchten Prozessbetrug nebst mittelbarer Falschbeurkundung inhaltlich nicht zu kritisieren.

45

In einer Konstellation, in der laut Sachverhalt der Käufer eines PKW den Verkäufer auf Minderung wegen Sachmangels verklagt und im Laufe des Prozesses unmittelbar vor der Untersuchung des PKW durch einen gerichtlich bestellten Sachverständigen die Bremsen manipuliert, um seine Prozesschancen zu erhöhen, stellte der Kläger fest, der Käufer habe in der Absicht gehandelt, den „zeitlich nachfolgenden“ Prozessbetrug zu ermöglichen. „Aufgrund der zeitlichen Zäsur“ stehe der gefährliche Eingriff in den Straßenverkehr in Tatmehrheit zu den anderen bereits genannten Delikten. Hier ist die Randbemerkung des Erstprüfers, bezogen auf die zeitliche Zäsur, „worin die liegen soll, wird aus dem Vorstehenden nicht deutlich“ durchaus angebracht und keinesfalls unverständlich. Denn es ist gerade nicht so, dass ein klarer zeitlicher Abstand zwischen den Delikten nach § 315b StGB einerseits und nach §§ 263, 271 Abs. 1 StGB andererseits bestünde. Es mag zwar auch für einen „unbefangenen Leser“ aus dem Text hervorgehen, dass der Kläger eine zeitliche Zäsur „zwischen Betrug und vorangegangener Straßenverkehrsgefährdung“ (richtig: vorangegangenem gefährlichem Eingriff in den Straßenverkehr) annimmt, gerade nicht deutlich wird jedoch, „worin“ diese Zäsur bestehen soll. Dies gilt umso mehr, als der Kläger auf S. 6 seiner Bearbeitung davon ausgeht, dass der Käufer selbst unmittelbar zur Verwirklichung des Betrugs angesetzt habe, also nach der Vorstellung des Klägers der Betrugsbeginn bereits in der Manipulation der Bremsen zu sehen ist. Darüber hinaus ist die zeitliche Abfolge allein nach strafrechtlicher Lehre kein entscheidendes Kriterium für die fragliche Abgrenzung zwischen natürlicher Handlungseinheit (zeitliche Abfolge) und Tatmehrheit (zeitliche Zäsur). Worin diese besteht, ist daher auch bei Ungleichzeitigkeit näher zu erläutern.

46

Weiter geht das Verwaltungsgericht in der Annahme fehl, eine Bewertung mit „zwei Punkte, mangelhaft“ bedeute „schon im Ansatz so gut wie nicht brauchbar“. Diese Annahme steht bereits im Widerspruch zur normativen Umschreibung der Bewertung in § 14 JAPrO 1993 i.V.m. § 1 der VO des Bundesministers der Justiz über eine Noten- und Punkteskala für die erste und zweite juristische Prüfung, auf die dieser Paragraph verweist. Demnach ist „mangelhaft“ „eine an erheblichen Mängeln leidende, im ganzen nicht mehr brauchbare Leistung“, wofür zwischen einem und drei Punkten zu vergeben sind, während „eine völlig unbrauchbare Leistung“ mit „ungenügend“ und damit null Punkten zu bewerten ist. Demnach ist eine mit zwei Punkten bewertete Leistung von - völliger - Unbrauchbarkeit noch entfernt. Zutreffend ist, dass nicht jede mängelbehaftete Arbeit als mangelhaft einzustufen ist, da nach der genannten Notenbeschreibung auch eine „ausreichend“ bewertete Leistung Mängel aufweist. Weiter trifft es zu, dass aus der Bewertung hervorgehen muss, wie aus der Sicht des Bewertenden die Note zustande gekommen ist. Nicht erforderlich ist dabei ein Offenlegen des - jeweiligen - Bewertungsmaßstabes. Es reicht aus, ist aber auch erforderlich, dass die Begründung die Note trägt (s. zu beidem ausführlich unter d). Dies ist aber sowohl hinsichtlich der Bewertung des Erstprüfers mit zwei Punkten als auch hinsichtlich der Bewertung durch den Zweitprüfer mit drei Punkten der Fall. Tragende Gründe des Erstprüfers sind die näher dargelegten Lücken und Fehler und insbesondere ein fast durchgängiges Fehlen korrekter juristischer Subsumtion und Begründung, also der Basis jeglicher qualifizierter juristischer Äußerung. Damit ist eine Bewertung deutlich unterhalb von vier Punkten hinreichend begründet. Einer weitergehenden Abgrenzung von oder auch der Umschreibung einer Leistung, die noch mit vier Punkten hätte gewertet werden können, bedarf es nicht.

47

In entsprechender Weise reicht auch die Begründung des Zweitprüfers für seine Bewertung mit drei Punkten aus, da er die Leistung des Klägers lediglich in einem bestimmten Teil - „im Hinblick auf die Ausführungen zur objektiven Zurechnung bei eigenverantwortlicher Selbstgefährdung“ - in ihrer Qualität aufwertet, zugleich jedoch die Beurteilung des Erstprüfers im Übrigen, also auch hinsichtlich seiner tragenden grundsätzlichen Kritik an der Darstellung, übernimmt und - konsequent - die Leistung als nicht durchschnittlichen Anforderungen entsprechend - und damit noch nicht als „ausreichend“ - ansieht.

48

c) Im Ergebnis zu Recht hat das Verwaltungsgericht den Beklagten zur Neubewertung der Aufsichtsarbeit Nummer 5 durch beide Prüfer verpflichtet. Insoweit bleibt die Berufung des Beklagten ohne Erfolg.

49

Die Ausführungen im Erstgutachten sind in doppelter Hinsicht anfechtbar. Zum einen verletzen die Ausführungen des Erstprüfers den allgemeinen Bewertungsgrundsatz der Sachlichkeit, der jeden Prüfer dazu verpflichtet, sachfremde Erwägungen zu unterlassen und Prüfungsleistungen mit innerer Distanz und emotionsfrei zur Kenntnis zu nehmen (vgl. BVerwG, Urteil vom 20.09.1984 - 7 C 57/83 -, BVerwGE 70, 143, 151 f. und Senatsurteil vom 24.04.1990 - 9 S 3227/89 -). Verletzt ist dieser Grundsatz jedenfalls dann, wenn die Form der Bewertung zu dem Schluss zwingt, der Prüfer habe die gebotene Gelassenheit und Distanz verloren, ohne die eine gerechte Beurteilung schwerlich gelingen kann (dazu unter aa). Zum anderen liegt auch nach Ansicht des Senats ein einzelner Bewertungsmangel vor (dazu unter bb).

50

aa) Ein Verstoß gegen das Gebot der Sachlichkeit muss angesichts der Häufung emotionaler Bemerkungen schon in den Randbemerkungen, dann auch im Bewertungsgutachten und insbesondere deshalb angenommen werden, weil dieser emotionsbetonte Stil auch im Überdenkensverfahren seine Fortsetzung findet. Bereits an den Randbemerkungen fällt auf, dass der Erstprüfer sehr häufig - insgesamt zwölf Mal - eine Passage als „schief“, „ganz schief“ oder „sehr schief“ bezeichnet. Zwar kann eine solche Bemerkung in der Sache durchaus angebracht sein, etwa als Hinweis darauf, dass ein Gedanke nicht hinreichend präzise geführt erscheint, eine Definition nicht völlig falsch aber ungenau ist oder auch die Anwendung einer bestimmten Norm auf einen bestimmten Sachverhalt nicht recht passt. Aber durch diese Häufung wird, auch wenn die Bemerkung in jedem einzelnen Fall angebracht sein mag, darüber hinaus zugleich auch der Eindruck transportiert, es fehle nicht nur an der gebotenen Exaktheit des Ausdrucks und damit auch der Gedankenführung, sondern der Kandidat sei dazu auch überhaupt nicht in der Lage. Verstärkt werden diese Zweifel durch „starke“ Ausdrücke wie „absurd“ und „abseitig“, auch wenn Kritik in dieser deutlichen Form für sich genommen bei der Korrektur schriftlicher Arbeiten noch zulässig sein kann (BVerwG, Urteil vom 20.09.1984, BVerwGE 70, 143 [152]). In die selbe Richtung geht der Hinweis, der Prüfling möge „argumentieren“ und nicht „'wohl richtige Meinungen' nachbeten“ und der Hinweis, Ausführungen seien „nicht sinnstiftend“. Schon diese Randbemerkungen sind, auch wenn sie sachlich begründbar sind, ihrer Form wegen in ihrer Gesamtheit dazu geeignet anzunehmen, dass der Prüfer tatsächlich nicht nur die Falllösung selbst sondern auch deren Verfasser im Blick hat und dieser Blick nicht mehr rein sachlich und distanziert ist. Da einem Korrektor ein Urteil in dieser Allgemeinheit über die Person eines Prüflings nicht zusteht, ist bereits dieser Eindruck geeignet, Zweifel daran zu wecken, ob der Prüfer noch zu einer ausschließlich sachbezogenen Bewertung nicht der Person sondern allein dessen Leistung in der Lage ist.

51

Dieser Eindruck wird durch den Stil des Votums nicht gemildert, vielmehr noch verstärkt, wenn neben den bereits genannten Ausdrücken „vollkommen absurd“, „(ganz) schief“ oder „nicht sinnstiftend“ im Text eine Reihe von Wörtern erscheint (wie: endlich, seltsamerweise, immerhin, wenigstens, erschreckend schwach, immerhin konsequent), die dazu geeignet sind, beim Leser den Eindruck zu erwecken, der Prüfer sei erstaunt darüber, wie eine solche Leistung habe zustande kommen können.

52

Insbesondere aber erscheint das Gebot der Sachlichkeit durch den Prüfer nicht in angemessener Weise gewahrt, wenn er auch noch anlässlich des zeitlich späteren Überdenkens seines Votums weiterhin in unverändert emotionaler Weise reagiert. Das beginnt bereits damit, dass er sich „entschieden gegen die Behauptung“ verwahrt, „die Klausur sei ohne die gebotene emotionale Distanz korrigiert worden“. Dass es dem Erstprüfer offenbar schwerfällt, die Wirkung seiner Formulierungen einzuschätzen, zeigt sich auch in seiner Behauptung, wer seine Randbemerkungen und sein Votum „unbefangen“ durchlese, werde feststellen, „dass es mir (selbstverständlich) ausschließlich um Kritik in der Sache ging“. Darüber hinaus enthalten auch seine Ausführungen im „Überdenkensverfahren“ weitere Formulierungen, die zu einer sachlich distanzierten Haltung nicht passen und daher Veranlassung geben, hierin eine von Emotionen gesteuerte Reaktion zu sehen. Das gilt für die Ausdrücke „(Halb-)Wissen“ oder „enigmatische Ausführungen“ ebenso wie für besserwisserisch wirkende Hinweise wie „Bloße Behauptungen bringen im juristischen Gutachten gar nichts!“, „Auch dies hat leider mit einem juristischen Gutachten nichts zu tun“, der Kläger behaupte „allen Ernstes“, er habe „die Problematik leider nach wie vor nicht verstanden“ oder „mit einem vermeintlichen 'Antwortspielraum' (habe) dies aus den dargelegten Gründen nichts zu tun.“

53

Jedenfalls in der Summe führen diese Bemerkungen, auch wenn sie einer, wie vorgetragen, persönlichkeitsbezogenen Emotionalität des Erstprüfers geschuldet sein mögen, zu der Feststellung, dass bei der Erstbegutachtung der Aufsichtsarbeit Nummer 5 des Klägers das Gebot der Sachlichkeit und emotionalen Distanz nicht eingehalten worden ist. Dies führt weiter dazu, dass von diesem Prüfer nach Überzeugung des Senats, zumal nach den im vorliegenden Urteil getroffenen Feststellungen und deren Kenntnisnahme, eine erneute, allein sachorientierte und emotional distanzierte Bewertung dieser Klausur nicht erwartet werden kann. Daher ist der Beklagte dazu verpflichtet, die erneute Bewertung der Klausur Nummer 5 durch einen anderen geeigneten Korrektor als Erstprüfer vornehmen zu lassen. Geeignet in diesem Sinne sind zur Wahrung der Chancengleichheit des Klägers - auch im Vergleich zu seinen damaligen Mitprüflingen - allein die Prüfer, die an der Bewertung dieser im Herbst 2007 gestellten Aufgabe beteiligt waren, da nur auf diesem Wege das Ziel erreicht werden kann, dass nach Möglichkeit dieselben Maßstäbe, Vorstellungen und Erfahrungen der gebotenen Nachkorrektur zugrunde gelegt werden, die bereits bei der Erstkorrektur vorlagen (vgl. BVerwG, Urteil vom 24.02.1993 - 6 C 38/92 -, NVwZ 1993, 686, 688).

54

Nur klarstellend ist darauf hinzuweisen, dass als Ergebnis einer erneuten Bewertung einer Prüfungsleistung keine Verschlechterung eintreten darf, weil dies dem Gebot der Chancengleichheit zuwiderlaufen würde (BVerwG, Urteil vom 24.02.1993 a.a.O.). Dies gilt auch für den Fall, dass ein anderer Prüfer für die Bewertung einer einzelnen Prüfungsleistung heranzuziehen ist.

55

bb) Neben der Frage des emotionalen Engagements ist in den Ausführungen des Erstprüfers auch ein Bewertungsmangel zu erkennen. Entgegen der Annahme des Verwaltungsgerichts ist ein solcher Mangel allerdings weder darin zu sehen, dass der Erstprüfer die Annahme des Klägers, es sei Strafbarkeit des F wegen eines versuchten Tötungsdelikts an K durch Unterlassen bei Ingerenz zu prüfen, als „gänzlich unvertretbar“ bezeichnet habe, noch in dessen Bewertung der Abgrenzung zwischen § 315c und § 315b StGB auf S. 2 der Klausurbearbeitung als „ganz unnötig“.

56

Tatsächlich lautet die Randbemerkung des Erstprüfers zum versuchten Tötungsdelikt „gröblichst falsch“, woran er auch in seiner Stellungnahme nach Überdenken festhielt. Diese Einschätzung hält das Verwaltungsgericht deshalb für fehlerhaft, weil „die Prüfung eines Unterlassungsdelikts vor dem Hintergrund, dass F den G zum Fahren animierte, obwohl er dessen Alkoholkonsum kannte“ nicht gänzlich abwegig sei. Aus seinem vorangegangenen Verhalten in der Kneipe lasse sich durchaus eine Pflichtenstellung des F im Hinblick auf K ableiten, zumal F die Fahruntüchtigkeit des G erkannt habe und diesen trotzdem zum Heimtransport des K animiert habe, der dann wegen eines von G verschuldeten Unfalls lebensgefährlich verletzt wurde. Diese Kritik an den Ausführungen des Erstprüfers ist nicht schlüssig. Der Erstprüfer stützt die Bewertung der entsprechenden Passagen in der Klausurbearbeitung nicht auf die Frage der Ingerenz sondern darauf, dass F in dem Tatkomplex, den der Kläger laut seiner Überschrift - Tatkomplex 2: „Die Ereignisse nach dem Unfall“ - auf S. 17 der Bearbeitung prüfte, handelnd eingreift und schon deshalb eine Strafbarkeit wegen Unterlassens nicht in Betracht kommt. Darauf, ob eine Verantwortlichkeit aus vorangegangenem gefahrerhöhendem Tun anzunehmen sei, kam es daher aus der Sicht des Erstprüfers nicht mehr an. Betont wird vielmehr neben dem aktiven Handeln die Unvertretbarkeit eines Tötungsvorsatzes und eine mangelhafte Prüfung des Tatentschlusses. Gerade die Annahme dieses Vorsatzes wird als „gröblichst falsch“ bezeichnet. Zugleich hat der Prüfer, wie sich aus seiner Randbemerkung auf S. 18 ergibt, gesehen, dass sich eine Verantwortlichkeit des F allein aus dem Geschehen in der Kneipe ergeben kann. Da die Bewertung der Prüfung eines „versuchten Unterlassungstotschlags“ als „gröblichst falsch“ mit den Hinweisen auf aktives Tun, fehlenden Tötungsvorsatz und gravierende Mängel bei der Prüfung des Tatentschlusses überzeugend begründet ist, liegt ein Bewertungsmangel insoweit nicht vor.

57

Die Kritik des Erstprüfers an der Abgrenzung des § 315c StGB von § 315b StGB auf S. 2 der Klausurbearbeitung stellt entgegen der Feststellung des Verwaltungsgerichts auch keine fehlerhafte Überbewertung dar. Zu diesem Einschub hat der Erstprüfer in seinem Gutachten lediglich festgestellt, die Abgrenzung sei „im Fall ganz unnötig“. Da der Sachverhalt einen ganz gewöhnlichen alkoholbedingten Verkehrsunfall beschreibt, unterliegt die Richtigkeit dieser Feststellung keinem Zweifel. Auch das Kundtun der Nichteinschlägigkeit einer Norm kann je nach Konstellation „ganz unnötig“ sein. Eine entsprechende - zutreffende - Feststellung ist dann nicht als „Überbewertung“ anzusehen.

58

Hinsichtlich der weiteren Einwände des Klägers, mit denen er bereits vor dem Verwaltungsgericht nicht durchgedrungen ist und die er gegenüber dem Senat nicht wiederholt hat, wird auf die Ausführungen des Verwaltungsgerichts (S. 21 f. des Urteils) verwiesen.

59

Dagegen ist ein Bewertungsmangel - nicht jedoch wie vom Verwaltungsgericht angenommen das Anlegen eines fehlerhaften Bewertungsmaßstabes - bezogen auf die Ausführungen des Klägers zur Feststellung absoluter Fahruntüchtigkeit anzunehmen.

60

Hierzu hat der Erstprüfer in seinem Gutachten festgestellt: „Der - grundsätzlich richtig erkannte - Grenzwert von 1,1 ‰ soll sich ganz schief nur unter Anrechnung eines 'Sicherheitszuschlags von 0,1 ‰' ergeben. Hier verwechselt der Bearbeiter etwas!“ Im Überdenkensverfahren ergänzt der Erstprüfer: „waren die Darlegungen … nicht nur überflüssig, sondern in der gewählten stark verkürzten Form auch in der Tat … 'unverständlich'. Plausibel … wären die Ausführungen nur dann gewesen, wenn sich der Widerspruchsführer … zunächst auf das im damaligen BGH-Verfahren eingeholte Sachverständigengutachten bezogen hätte, wonach nach (damals) neuen medizinischen Erkenntnissen die absolute Fahruntüchtigkeit bereits bei 1,0 ‰ beginnt, und dann auf den Sicherheitszuschlag von 0,1 ‰ hingewiesen hätte.“

61

Aus diesen Bemerkungen geht hervor, dass der Erstprüfer die Ausführungen des Klägers zur absoluten Fahruntüchtigkeit negativ bewertet hat. Allem Anschein nach hätte ihm die bloße Angabe „1,1 ‰“ vollständig genügt, da dieser Grenzwert ständiger Rechtsprechung seit 20 Jahren entspreche. Dies ergibt sich indirekt auch daraus, dass diese Ausführungen nicht unter den „positiven Aspekten“ aufgeführt sind, die der Erstprüfer am Ende seiner Darlegungen im Überdenkensverfahren aufzählt. Diese negative Gewichtung ist nicht gerechtfertigt und stellt einen Bewertungsmangel dar, denn es ist nicht nachvollziehbar, was an den Angaben des Klägers „ganz schief“ sein soll und welcher Verwechslung der Kläger dabei zum Opfer gefallen sein soll.

62

Zur absoluten alkoholbedingten Fahruntüchtigkeit schreibt der Kläger auf S. 3: „Denn der hierfür maßgebliche Grenzwert einschließlich eines Sicherheitszuschlags von 0,1 ‰ liegt bei 1,1 ‰.“ Mit dieser Beschreibung befindet er sich in Übereinstimmung mit maßgeblicher einschlägiger Literatur: Peter Hentschel, Trunkenheit - Fahrerlaubnisentzug - Fahrverbot, 9. Auflage 2003 Rn. 87: „Der Grenzwert von 1,1 ‰ setzt sich also aus dem Grundwert von 1,0 ‰ und einem Sicherheitszuschlag von 0,1 ‰ zusammen“. Ebenso Thomas Fischer, Strafgesetzbuch und Nebengesetze, 57. Auflage 2010, § 316 Rn. 26: „Hiernach ist der Grundwert der alkoholbedingten absoluten Fahruntüchtigkeit bei 1,0 ‰ anzusetzen und ein Sicherheitszuschlag von 0,1 ‰ als ausreichend zu erachten, woraus sich der in BGH[St] 37, 89 festgesetzte Grenzwert von 1,1 ‰ ergibt“. Was an der Festlegung des Klägers „schief“ sein soll, ist ebenso wenig zu erkennen wie, dass er etwas verwechselt habe. Auch für die Annahme des Beklagten, der Kläger habe einen „Sicherheitszuschlag“ auf den Grenzwert und nicht auf das Ergebnis einer Messmethode vorgenommen, gibt das Zitat aus dessen Bearbeitung nichts her. Vielmehr beschreibt der Kläger einen Grenzwert „einschließlich“ eines Sicherheitszuschlags und nicht etwas „zuzüglich“ dessen. Die Verwechslung mit einem sonstigen „Sicherheitszuschlag“ bei der Ermittlung der Blutalkoholkonzentration eines Täters liegt ebenso wenig nahe. Daher ist der zitierte Satz in der Bearbeitung des Klägers für sich genommen als korrekt zu betrachten. Seine Gewichtung und sich daraus ergebende Bedeutung für die Bewertung der Fallbearbeitung insgesamt bleibt ungeachtet dessen vollständig der künftigen Neubewertung überlassen.

63

Da sich der Zweitprüfer der Bewertung des Erstprüfers lediglich vollumfänglich angeschlossen hat - was zulässig ist -, und daher angenommen werden muss, dass sich diese Übernahme der Bewertung auch auf den festgestellten Bewertungsmangel bezieht, muss auch eine erneute Zweitbewertung durch ihn erfolgen.

64

d) Hinsichtlich der Klausur Nummer 6 hat die Berufung insoweit - teilweise - Erfolg, als ein Bewertungsmangel durch den Erstprüfer nicht vorliegt und daher eine erneute Bewertung allein durch den Zweitprüfer zu erfolgen hat.

65

Zu Recht hat der Erstprüfer die Ausführungen des Klägers zur Antragsberechtigung im Rahmen der abstrakten Normenkontrolle vor dem Bundesverfassungsgericht als unklar bzw. missverständlich angesehen. Seinen kurzen Hinweis im Gutachten „Schwächen bei den prozessualen Ausführungen“ hat der Erstprüfer im Überdenkensverfahren näher erläutert. An der Stelle, wo der Kläger von einer „Antragsberechtigung der 'Landesregierung als Kollektiv' rede, sei nicht klar, ob die X-Fraktion oder deren Abgeordnete als Teile der Landesregierung angesehen würden oder ob damit (zutreffend) klargestellt werde, dass nur „die Landesregierung“ antragsberechtigt ist.

66

Diese Unklarheit besteht und durfte vom Erstprüfer auch kritisch vermerkt werden. Laut Aufgabenstellung ist zu prüfen, welche verfassungsgerichtlichen Verfahren die X-Fraktion des baden-württembergischen Landtags mit Aussicht auf Erfolg betreiben kann. Auf S. 4 der Bearbeitung führt der Kläger im Rahmen der Prüfung einer abstrakten Normenkontrolle vor dem Bundesverfassungsgericht aus, die - nicht näher bezeichnete - „Antragstellerin“ genüge „in mehrfacher Hinsicht nicht den gesetzlichen Anforderungen an die Antragsberechtigung für das hier gewählte Verfahren vor dem BVerfG. Zum einen ist eine Landesregierung nur insgesamt, als Kollektiv, antragsberechtigt und zum anderen wäre hier selbst im Falle eine(!) Analogie das erforderliche 1/3 Quorum nicht erreicht.“

67

Aus diesen Ausführungen ergibt sich zumindest nicht mit der gebotenen Klarheit, in welchem Verhältnis nach Ansicht des Klägers die - antragsberechtigte und von ihm genannte - Landesregierung zur laut Sachverhalt antragstellenden X-Fraktion bzw. deren Abgeordneten steht. Diese Unklarheit wird noch dadurch verstärkt, dass der Kläger auf S. 6, wo er die „Antragstellerin“ erstmals näher bezeichnet, die „X-Partei“ und nicht etwa die X-Fraktion als Antragstellerin nennt. Die Betonung der „Landesregierung insgesamt, als Kollektiv“ deutet eher darauf hin, dass er die „Antragstellerin“ als - bloßen - Teil der Landesregierung ansieht und somit möglicherweise nicht zwischen Landesparlament und -regierung unterscheidet bzw. beide Organe miteinander verwechselt. Auch der Hinweis auf das „erforderliche 1/3 Quorum“ hilft nicht weiter, weil bei keinem der in Frage kommenden Verfahren ein solches Quorum genannt wird. Auch ein „eindeutiger Gesetzeswortlaut“ kann nur dann zu einer unmissverständlichen Aussage des Bearbeiters einer Klausur führen, wenn dessen Formulierung hinreichend klar ist. Dies ist hier nicht der Fall.

68

Zu den weiteren Einwendungen der Korrektur durch den Erstprüfer, mit denen der Kläger schon in der ersten Instanz nicht durchgedrungen ist, wird auch hier auf die Ausführungen im Urteil vom 12.08.2009, dort S. 24, verwiesen.

69

Erfolg hat der Kläger dagegen insoweit, als er vorträgt, die Abweichung des Zweitprüfers von der vom Erstprüfer vergebenen Punktzahl um einen - entscheidenden - Punkt von vier nach drei Punkten sei nicht nachvollziehbar begründet. Dies trifft zu und führt zur Verpflichtung des Beklagten, diese Klausur durch den Zweitprüfer erneut bewerten zu lassen.

70

Jede Bewertung muss geeignet sein, die vergebene Note zu tragen. Die für die Bewertung maßgeblichen Gesichtspunkte müssen sich aus der Begründung der Prüferbewertung erkennbar und nachvollziehbar ergeben. Es muss anhand der Begründung für den Prüfling und die Gerichte möglich sein, die grundlegenden Gedanken der Prüfer nachzuvollziehen (vgl. etwa Bay.VGH, Beschluss vom 29.04.2009 - 7 ZB 08.996 -; BVerwG, Urteil vom 16.03.1994 - 6 C 5/93 -, NVwZ-RR 1994, 582 [583]; ebenso Senatsbeschluss vom 16.09.2002 - 9 S 1704/02 -). Dies gilt auch im Verhältnis der Notenvergabe durch den Zweitprüfer und dessen - möglicher - Bezugnahme auf die ihm bekannte Bewertung und Benotung durch den Erstprüfer. Daher ist es einerseits zulässig, sich - wie etwa der Zweitprüfer der Klausur Nummer 5 im vorliegenden Fall - mit der Bewertung und Benotung lediglich „einverstanden“ zu erklären (vgl. BVerwG, Urteil vom 16.03.1994 a.a.O. S. 584). Auch bringt es der den Prüfern bei prüfungsspezifischen Bewertungen zukommende Beurteilungsspielraum mit sich, dass ein und dieselbe Prüfungsleistung von dem einen Prüfer mit drei Punkten und von dem anderen mit vier Punkten bewertet werden kann, ohne dass eine der Bewertungen den Bewertungsspielraum überschritte und rechtlich zu beanstanden wäre (BVerwG, Beschluss vom 13.05.2004 - 6 B 25/04 -, NVwZ 2004, 1375 [1376]). Soweit der Zweitprüfer jedoch von der Benotung durch den Erstprüfer abweicht, muss sich andererseits diese Abweichung aus seiner Bewertung plausibel und nachvollziehbar ergeben. Dies ist nicht mehr der Fall, wenn sich der Zweitprüfer zwar den Ausführungen des Erstprüfers hinsichtlich der in der Bearbeitung enthaltenen Mängel uneingeschränkt anschließt, aber ungeachtet dessen diese Arbeit schlechter bewertet. Jedenfalls dann, wenn diese Abweichung nicht nur zu einer anderen Notenstufe sondern sogar dazu führt, dass - aus Sicht des Zweitprüfers - die Klausur als „nicht bestanden“ zu betrachten ist, reicht es nicht aus, lediglich auf den eigenen - vom Erstprüfer abweichenden - Erwartungshorizont zu verweisen, dem die Leistung nicht genügt habe. Vielmehr ist es erforderlich, auch inhaltlich darzulegen, aus welchen Gründen die Leistung entgegen der Einschätzung des Erstprüfers nicht mehr durchschnittlichen Anforderungen entspricht.

71

Diesen Anforderungen genügt die Bewertung durch den Zweitprüfer der Klausur Nummer 6 nicht. Bereits seine lapidare erste Bewertung der Bearbeitung durch den Kläger als „weitgehend oberflächlich und substanzlos“ dürfte angesichts ihrer Kürze und Pauschalität nicht geeignet sein, eine Benotung als „nicht mehr brauchbar, daher mangelhaft (3 Punkte)“ zu tragen. Jedenfalls aber ist sein Festhalten an dieser Benotung im Überdenkensverfahren nicht plausibel. Hier stellt der Zweitkorrektor fest: „Wie der Erstkorrektor … zu Recht ausgeführt hat, hat der Verf. die zentralen Probleme der Arbeit nicht berührt, …, keines der eigentlichen Probleme wurde adäquat behandelt. Dieser Einschätzung habe ich mich angeschlossen,“ um dann fortzufahren, „halte die Arbeit aber nicht mehr für ausreichend“. Damit wird den Anforderungen an eine plausible, die Benotung tragende Begründung nicht genügt. Auch bei einem - zulässigerweise - abweichenden Erwartungshorizont muss der jeweilige Prüfer verdeutlichen, warum aus seiner Sicht eine Leistung in eine bestimmte Notenstufe - hier: eine Leistung, die trotz ihrer Mängel durchschnittlichen Anforderungen noch entspricht - noch oder nicht mehr einzuordnen ist. Wenn ausdrücklich der Analyse eines anderen Prüfers hinsichtlich der vorhandenen Mängel gefolgt wird, muss aus der eigenen Bewertung wenigstens hervorgehen, aus welchen Gründen von der Einschätzung jenes Prüfers abweichend diesen Mängeln ein größeres Gewicht beigemessen wird. Der bloße Hinweis darauf, dass auch der andere Prüfer „nur mit Mühe noch“ vier Punkte vergeben habe, genügt hierfür nicht.

72

Daher ist der Beklagte verpflichtet, die Klausur Nummer 6 nochmals durch den Zweitprüfer bewerten und benoten zu lassen.

73

In diesem Zusammenhang ist grundsätzlich darauf hinzuweisen, dass ein Prüfer nicht verpflichtet ist, seinen Bewertungsmaßstab in der Weise offen zu legen, dass einem - mit entsprechenden Notenstufen unterlegten - Erwartungshorizont die tatsächlich erbrachte Leistung gegenübergestellt wird. Dass ein Prüfer sein „Bewertungssystem“ nicht in jedem Fall offenlegen muss, hat der Senat bereits in seinem Beschluss vom 16.09.2002 - 9 S 1704/02 - festgestellt und hält daran weiterhin fest. Gerade bei juristischen Prüfungen, aber auch vielfach bei anderen Prüfungen ergibt sich eine Bewertung nicht allein aus einem Vergleich des Anteils „richtiger“ oder „falscher“ Aussagen, sondern darüber hinaus etwa aus der Art der Darstellung, der Herangehensweise bei der Lösung eines Problems, der Geeignetheit bis Originalität der Gedankenführung und -darstellung. Das Verhältnis solcher „allgemeiner Anforderungen“ zu den konkreten „richtigen“ oder „falschen“ inhaltlichen Ausführungen ist derart variabel, dass ein einheitliches, auf sämtliche Prüfungsleistungen anwendbares Schema kaum zu erstellen ist und von den Prüfern daher auch nicht erwartet werden kann. Dies gilt umso mehr, als auch von einer „Musterlösung“ abweichende Falllösungen angemessen zu bewerten und zu würdigen sind. Darum stellen auch die von dem Beklagten den Prüfern zur Verfügung gestellten „Musterlösungen“ niemals ein derartiges „Prüfungsschema“ dar, sondern sind stets bloße Hinweise auf die in der Aufgabe aus der - vorläufigen - Sicht des Aufgabenstellers enthaltenen Fragestellungen. Auch der Anspruch auf effektiven Rechtsschutz aus Art. 19 Abs. 4 GG oder der Umstand, dass ein Offenlegen eines solchen „Erwartungshorizontes“ oder „Bewertungsmaßstabes“ die gerichtliche Überprüfung von Prüferentscheidungen möglicherweise erleichtern würde, führt grundsätzlich nicht zu einer entsprechenden Verpflichtung. Die Frage, welche Leistungen in einer bestimmten Prüfung von den Kandidaten erwartet werden können und inwieweit eine konkrete Leistung diesen Erwartungen genügt, ist - von willkürlichen Fehleinschätzungen abgesehen - Teil des gerichtlich nicht überprüfbaren Beurteilungsspielraums der zur Beurteilung der Examensleistungen berufenen Prüfer. Daher reicht es aus, wenn ein Prüfer die wesentlichen, seine Bewertung tragenden Gründe in schlüssiger und nachvollziehbarer Weise darlegt (vgl. BVerwG, Urteil vom 16.03.1994 a.a.O. S. 583).

74

3. Die Kostenentscheidung beruht auf § 155 Abs. 1 Satz 1 VwGO. Die Kosten sind hälftig zu teilen, da der Kläger die Bewertung von vier Klausuren angegriffen und insoweit obsiegt hat, als die Bewertung zweier Klausuren - ganz oder teilweise - erneut vorzunehmen ist (vgl. Senatsurteil vom 14.12.1999 - 9 S 1725/99 - und BVerwG, Urteil vom 11.08.1993 - 6 C 2/93 -, insoweit nur in juris, Rn. 56). Damit ist die Klage teilweise erfolgreich, denn diese Neubewertung beider Klausuren eröffnet dem Kläger die Chance, zur mündlichen Prüfung zugelassen zu werden.

75

4. Die Revision wird nicht zugelassen, denn es liegt keiner der in § 132 Abs. 2 VwGO genannten Zulassungsgründe vor.

76

Beschluss vom 10. November 2010

77

Der Streitwert des Berufungsverfahrens wird auf 7.500,-- EUR festgesetzt (vgl. §§ 47 Abs. 1 Satz 1, 52 Abs. 2 GKG i.V.m. Nr. 36.1 des Streitwertkatalogs der Verwaltungsgerichtsbarkeit, NVwZ 2004, 1327).

78

Dieser Beschluss ist unanfechtbar.

 


Abkürzung Fundstelle Diesen Link können Sie kopieren und verwenden, wenn Sie genau dieses Dokument verlinken möchten:
http://www.landesrecht-bw.de/jportal/?quelle=jlink&docid=MWRE100003554&psml=bsbawueprod.psml&max=true