Fragenkatalog Datenmanagement und Sicherung der IQ PDF

Title Fragenkatalog Datenmanagement und Sicherung der IQ
Author samir lamine
Course Datenmanagement und Sicherung der Informationsqualität
Institution Universität Passau
Pages 34
File Size 1.6 MB
File Type PDF
Total Downloads 24
Total Views 125

Summary

Fragenkatalog Datenmanagement und Sicherung der IQ WS 17/18...


Description

Fragenkatalog Datenmanagement und Sicherung der IQ

Basiswissen:

1. Welche Merkmale bestimmen die Leistungsfähigkeit externer Datenspeicher bzw. Datenträger? - Schreib/Lesegeschwindigkeit - USB Version 2. Welche Zugriffsverfahren existieren? Nehmen Sie eine Zuordnung zu ausgewählten, gängigen Speichermedien vor! - Wahlweiser Zugriff (Random Access): Register, Cache, Hauptspeicher - Serieller Zugriff: Festplatte 3. Nennen sie die 3 Speicherarten, mit der Daten auf Datenträger gespeichert werden können - Mechanische Wandlung (Schallplatte) - Elektrische Wandlung (Musikkassette) - Elektronische Wandlung (CD, DVD, USB) 4. Welche physikalischen Verfahren werden zur Datenspeicherung genutzt? - Magnetische Speicherung - Mechanische Speicherung - Elektronische Speichermedien - Fotografische Speicherung - Optische Speicherung 5. Geben sie 5 Beispiele von Datenträgern und nennen Sie ihre dazugehörigen Speicherarten! - Lochkarte (mechanisch) - Kassette (elektrisch) - CD (elektronisch) - Fotofilm (fotografische Speicherung) - Laserdisc (optische Speicherung)

6. Sortieren Sie die folgenden Datenträger nach ihrer Zugriffsgeschwindigkeit: Kassette, USBStick, magnetische Festplatte, SSD - SSD, HDD, USB, Kassette

7. Was versteht man unter einem RAID-System? - Redundante Anordnung unabhängiger Festplatten. dient zur Organisation mehrerer physischer Massenspeicher (üblicherweise Festplattenlaufwerke oder Solid-State-Drives) zu einem logischen Laufwerk, das eine höhere Ausfallsicherheit oder einen größeren Datendurchsatz erlaubt als ein einzelnes physisches Speichermedium.

8. Was versteht man unter SAN und NAS? Worin bestehen die Gemeinsamkeiten und die Unterschiede? - (Storage Area Network): SAN-Verbindung von zwei oder mehr Rechnern - (Network Attached Storage): Zugriff auf den Speicher via Netzwerkverbindung. SAN wird in der Regel über spezielle Fibrechannel-Karten angebunden und ersetzt quasi Festplatten der Server. Diese Anbindung läuft nicht über LAN und ist auch dementsprechend schneller. Ein NAS hingegen hostet Netzlaufwerke wie NFS, CIFS

9. Was bedeutet KB, MB, GB, TB und PB? - Kilobyte, Megabyte, Gigabyte, Petabyte

10. Was versteht man unter einer Datei sowie unter der Dateiorganisation? Datei: auf einem Datenträger unter einem Namen gespeicherte, abrufbare Informationen, die eine Einheit bilden. Dateiorganisation: Methoden und Prinzipien zur Strukturierung einer Datei, bes. zur Anordnung der Datensätze und zum Wiederauffinden der Datensätze 11. Erläutern Sie kurz den Unterschied zwischen universellen und proprietären Dateispezifikationen. - Universell: Freies Format - Proprietär: urheberrechtlich geschützt

12. Nennen Sie je ein binär- und ein textbasiertes Dateiformat. - Binär: .bin - Text: .txt

13. Warum kann es nützlich sein, sich File-Extensions/Dateinamenerweiterungen im FileExplorer anzeigen zu lassen? - Um diese mit dem richtigen Programm öffnen zu können.

14. Kann ein Dateiformat nach dem Entfernen der Dateinamenerweiterung (.exe, etc.) noch vom Rechner bestimmt werden? - Nein.

15. Was ist ein Datenmodell und wozu dienen Datenmodelle? - dienen Datenmodelle und die zu deren Erstellung durchgeführten Aktivitäten (Datenmodellierung) dazu, die Struktur für die in den Systemen zu verarbeitenden (im Besonderen für die zu speichernden) Daten zu finden und festzulegen.

16. Nennen Sie die zentralen Begriffe des relationalen Datenmodells! - Tupel, Relation, Attribut

17. Nennen sie mindestens drei weitere Datenmodelltypen (neben dem relationalen Modell)! - Logisches Datenmodell - Konzeptionelles Datenmodell - Semantisches Datenmodell

18. Was ist die theoretische Basis des Relationenmodells? - Relationale Algebra 19. Beschreiben Sie das Vorgehen bei der Erstellung von Datenmodellen. - Ausgehend von der Betrachtung eines Ausschnitts der realen Welt werden die relevanten Objekte mit allen relevanten Eigenschaften und die relevanten Beziehungen zwischen ihnen erhoben, analysiert sowie grafisch und textuell formuliert.

20. Was versteht man unter einem Fremdschlüssel? - Attribut oder eine Attributkombination einer Relation, welches auf einen Primärschlüssel (bzw. Schlüsselkandidaten) einer anderen oder der gleichen Relation verweist. 21. Was versteht man unter Normalisierung von Datenmodellen? - Aufteilung von Attributen (Tabellenspalten) in mehrere Relationen (Tabellen) gemäß den Normalisierungsregeln, so dass eine Form entsteht, die keine vermeidbaren Redundanzen mehr enthält. 22. Erläutern Sie die erste Normalform! - Jedes Attribut ist atomar 23. Welche Anomalien können unterschieden werden? Erläutern Sie die Anomalieproblematik mit Hilfe des Beispiels! - Änderungsanomalie, Einfügeanomalie, Löschanomalie

24. Was versteht man unter logischer und unter physischer Datenunabhängigkeit? - Physische Datenunabhängigkeit weisen Datenbanksysteme auf, bei denen Änderungen an der physischen Speicher- oder der Zugriffsstruktur (beispielsweise das Anlegen oder Entfernen einer Indexstruktur) keine Auswirkungen auf die logische Struktur der Datenbasis, das Datenbankschema, haben. - Logische Datenunabhängigkeit bedeutet, dass Anwendungen gegen Änderungen, die am Datenbankschema vorgenommen werden, immun sind.

25. Erläutern Sie die Vorteile, die mit der Entwicklung von Datenbanksystemen durch die Trennung der Daten von der Beschreibung der Datenstruktur (Schema) entstanden sind.

26. Was versteht man unter Speicherhierarchien und wozu werden sie eingesetzt? - Hierarchische Speichermanagementsysteme lagern länger nicht benötigte Daten automatisch auf einen Speicher niedrigerer Hierarchiestufe aus

27. Erläutern Sie die 3-Schema-Architektur! - Die ANSI-SPARC-Architektur, auch Drei-Schema-Architektur, beschreibt die grundlegende Trennung verschiedener Beschreibungsebenen für Datenbankschemata.

28. Zu welchem Zweck wird das interne Schema und zu welchem das externe Schema benötigt? - Intern: Die interne Ebene (auch physische Ebene), die die physische Sicht der Datenbank im Computer darstellt. In ihr wird beschrieben, wie und wo die Daten in der Datenbank gespeichert werden. Designziel ist hier ein performanter Zugriff auf die gespeicherten Informationen. - Extern: Die externe Ebene, die den Benutzern und Anwendungen individuelle Benutzersichten bereitstellt. Beispiele: Formulare, Masken-Layouts, Listen, Schnittstellen.

29. Nennen Sie mindestens vier Anforderungen an ein DBMS! - Integritätssicherung - Redundanzarmut - Datensicherheit - Mehrbenutzerbetrieb

30. Erläutern Sie das ACID-Prinzip! - Atomarität, Konsistenz, Isolation und Dauerhaftigkeit.

31. Erläutern Sie Prinzip und Anwendungsbereich von Hashing! - Eine Hashfunktion (auch Streuwertfunktion) ist eine Abbildung, die eine große Eingabemenge (die Schlüssel) auf eine kleinere Zielmenge (die Hashwerte) abbildet.

32. Wozu ist das Logging in Verbindung mit dem Datenbankbetrieb erforderlich? - Unter LOGGING versteht man das Mitprotokollieren aller Änderungen, die auf der Datenbank gemacht wurden in System-Log-Dateien. 33. Sind mit dem Einsatz von Datenbanksystemen auch Nachteile verbunden? Wenn ja, welche? - Erschwerter Benutzungszugang - "Kenntnis" einer Datenbank nur über Erfahrungswissen - Unterschiedlichkeit der Suchsprachen und -oberflächen

34. Was ist eine Datenbanksprache und welche Arten von Datenbanksprachen können unterschieden werden? - Als Datenbanksprache bezeichnet man formale Sprachen, die für den Einsatz in Datenbanksystemen entwickelt wurden. Relationale und nicht-Relationale Sprachen

35. Was versteht man unter DDL, DML, DCL? - Data Definition language - Data Manipulation language - Data Control language

36. Was sind Integritätsbedingungen und wie können Sie in SQL dargestellt werden? - Integritätsbedingungen beschreiben Annahmen, die über die Daten bzw. den Zustand getroffen werden, beispielsweise ein bestimmter Datentyp, ein Wertebereich oder eine Abhängigkeitsbeziehung zwischen zwei Objekten.

37. Nennen Sie die elementaren Operationen auf Basis der Mengenalgebra und ihr Äquivalent in SQL! - Union, Intersect, Except

38. Wann bezeichnet man eine Datenbanksprache als relational vollständig? - Wenn jede Operation der relationalen Algebra in der Abfragesprache durch (mindestens) einen Ausdruck umgesetzt werden kann, heißt sie relational vollständig

39. Wovon hängt die Bearbeitungszeit von SQL-Anfragen ab? - Parallelität bei der Nutzung einzelner Betriebsmittel. Mehr CPU Kerne schaffen Abhilfe

40. Was sind Sichten bzw. Views und wozu werden Sie eingesetzt? - Virtuelle Relation. Die Aufgabe einer Sicht ist es, den Zugriff auf das Datenbankschema zu vereinfachen.

41. Warum ist die Skalierung ein Vorteil von NoSQL-Datenbanken? - In NoSQL-Systemen lassen sich zum Beispiel wesentlich größere Mengen an Daten ablegen, ohne an Performancegrenzen zu stoßen - Stichwort "horizontale Skalierbarkeit". Bei komplexen Abfrageanforderungen, etwa im Bereich von unstrukturierten Daten wie Video, Audio oder Bild-Dateien, erlauben einige NoSQL-Datenbanken baumförmige Strukturen der Metadaten ohne ein fest definiertes Datenschema und deren flexible Abfrage

42. Nennen Sie Weiterentwicklungen traditioneller relationaler Datenbankkonzepte - NoSQL

43. Ab Welchem Zeitraum spricht man von Langzeitarchivierung und warum ist sie erforderlich? - Ab 10 Jahren. Zum einen erfordern gesetzliche Vorgaben wie das Handelsgesetzbuch, die Abgabenordnung (AO) und die Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen (GDPdU)

44. Was versteht man unter revisionssicherer elektronischer Archivierung? - die Inhalte werden unverändert (originär) und fälschungssicher gespeichert, - die Inhalte sind durch eine Suche wieder findbar, - alle Aktionen im Archiv werden aus Gründen der Nachvollziehbarkeit protokolliert.

45. Nennen Sie zwei technische Probleme, die sich bei der Langzeitspeicherung von Daten ergeben können und beschreiben Sie kurz wie man ihnen entgegenwirken kann? - Funktionierendes Datenmanagement - Zusammenführung in Standardformate

46. Nennen Sie drei negative Folgen, die sich für ein Unternehmen aus einem ungewollten Datenverlust ergeben. - Verlust von Kundendaten - Verlust von Materialstammdaten - Offene Rechnungen

47. Nennen Sie die wichtigsten funktionalen Anforderungen an elektronische Archivsysteme! - Übernahme, Elektronisches Magazin, Erschließung, Bestandserhaltung, Nutzung

48. Welche Datenträger bzw. Speichermedien eignen sich aufgrund ihrer Lebensdauer besonders für die Langzeitarchivierung? - CAS, Worm-Bänder

49. Was sind WORM-Speicher? - Write once, read multiple. Sie bezeichnet Vorkehrungen in der Informationstechnik, die das Löschen, Überschreiben und Ändern von Daten auf einem Speichermedium dauerhaft ausschließen.

50. Was versteht man unter hybrider Archivierung und wie funktioniert sie? - bedeutet das gleichzeitige digitale und analoge Vorhalten von Daten. Analoges Backup Medium

51. Für wen bzw. welche Daten ist die Langzeitarchivierung Pflicht? - Für Unternehmen und digitale Geschäftsbriefe

52. Was regeln die GDPdU? - Die Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen (GDPdU) enthalten Regeln zur Aufbewahrung digitaler Unterlagen und zur Mitwirkungspflicht der Steuerpflichtigen bei Betriebsprüfungen.

53. In welcher Beziehung stehen GDPdU und GoBD und gibt es GoBD-konforme Software? - Ja

54. Was versteht man unter Linked Open Data? - bezeichnet im World Wide Web frei verfügbare Daten, die per Uniform Resource Identifier (URI) identifiziert sind und darüber direkt per HTTP abgerufen werden können und ebenfalls per URI auf andere Daten verweisen.

VL01 – Grundlagen und Begriffe

1. Was wird als Jahrhundertproblem der Informatik bezeichnet? - Bewältigung des Datenchaos, das infolge unkontrolliert gewachsener Datenbestände fast überall entstanden ist. -

Schaffung einer Basis für die effiziente Nutzung und zukunftssichere Verarbeitungsmöglichkeiten

2. Nennen sie typische Funktionen von Daten! - Dokumentation - Daten aufgrund gesetzlicher Vorschriften - Ressource/Betriebsmittel - Indikatoren (z.B. Kennzahlen bzgl. Qualität, Zeit, Kosten) - Daten als Entscheidungsgrundlage - Handelsware 3. Wie hat sich die Rolle von Daten in Unternehmen im Zeitverlauf verändert? - Erst Daten Prozessergebnis, dann Befähiger von Prozessen, dann Befähiger von Produkten, jetzt Produkt selbst

4. Welche Gründe gibt es für das erhöhe Datenwachstum? - Verbesserung der Verarbeitungsfähigkeit moderner Informationssysteme - Preisverfall von Speicherhardware - Neue Kommunikationstechnologien und Social Media (Mobiler Zugriff und Echtzeitdaten) - Eingebettete Systeme und IoT - Zunahme an gesetzlichen Richtlinien 5. Worin bestehen die Herausforderungen beim Umgang mit großen Datenmengen Beschreiben Sie einzelne Herausforderungen etwas genauer! Allgeei: Verfügarkeit, Siherheit, Veraltarkeit … Konkrete Themenfelder: - HW-technische Herausforderungen - SW-technische Herausforderungen - Compliance und rechtliche Herausforderungen - Herausforderungen bzgl. Datenschutz und Datensicherheit - Wirtschaftliche Herausforderungen - Sicherung der Datenkonsistenz

6. Welche Messgrößen für Datenmengen existieren? - KB, MB, GB, PB, TB, PB, EB, ZB, YB

7. Was versteht man unter der Universalität binärcodierter Daten? - Alles was zähl- und messbar ist, kann durch binärcodierte Daten ausgedrückt werden. Das sind nicht nur Zahlen und Texte, sondern alle physikalischen Größen und ihre zeitlichen Verläufe, insbesondere optische und akustische Größen, also Bilder, Sprache und Musik. Das wiederum hat die Konsequenz, dass Bilder, Sprache und Musik von Computern erzeugt und verarbeitet werden können. 8. Was sind überhaupt Daten? - Viele konkurrierende Begriffsdefinitionen! Daten und Informationen werden in der Informatik häufig synonym verwendet. Manche Fachleute sind der Meinung, dass Daten etwas so Elementares und gleichzeitig allgemein Bekanntes sind, dass der Begriff undefiniert bleiben kann. Im Unternehmenskontext ist die Definition bzw. Abgrenzung sinnvoll, um die Zuständigkeit festzulegen. Eigenschaften: Abbildung der Realität, Verwendung von Symbolen oder Zeichen eines Alphabets, Elektronische Speicherung (technische Repräsentation)

9. Erläutern Sie das semiotische Dreieck!

10. Was genau ist eine Ontologie und wozu kann sie eingesetzt werden? - „eine explizite, formale Spezifikation der Konzeptualisierung eines abgegrenzten Diskursbereichs zu einem definierten Zweck auf die sich eine Gruppe von Akteuren geeinigt hat - Ziel einer Ontologie ist die Wiederverwendung von Wissen

11. Welche Arten von Ontologien können unterschieden werden? Bitte erläutern Sie diese kurz. - Es existieren mehrere Kategorisierungen und Klassifizierungen für Ontologien -

Häufig verwendet wird die Klassifikation nach Guarino (1998): Top Level Ontologien Domänen-Ontologien Aufgaben-Ontologien Applikations-Ontologien

12. Skizzieren Sie ein Einsatzbeispiel für Ontologien im E-Business!

13. Welche Datenarten und Erscheinungsformen von Daten werden unterschieden?

14. Was versteht man unter Stamm-, Bewegungs- und Bestandsdaten? Erläutern Sie die Begriffe am Beispiel der Daten einer Universität.

15. Nehmen Sie eine Gegenüberstellung operativer und dispositiver Daten anhand ausgewählter Merkmale vor!

16. Was versteht man unter dem Datenlebenszyklus und wozu dient er?

17. Was sind Informationen (insbesondere wirtschaftswissenschaftlicher Informationsbegriff)? - Information = zweckbezogenes Wissen -

Semantischer Informationsbegriff: Handlungs- oder Entscheidungsrelevanz Information auch ohne Daten möglich Informationen sind im Unterschied zu Daten oft auch zeit- und ortsabhängig

18. Warum ist es sinnvoll zwischen Daten und Informationen zu unterscheiden und was bedeutet das für das IT-Management?

19. Worin besteht der Unterschied zwischen dem syntaktischen und dem semantischen Informationsbegriff?

20. Wozu dient die Berechnung des Informationsgehaltes? - Um zu wissen wieviel Information in einer Nachricht gegeben ist 21. Welche Voraussetzungen machen Informationen zu einem Wirtschaftsgut? Geben Sie ein Beispiel dafür.

22. Was versteht man unter einem Dokument? - Unter einem Dokument wird jede Art von strukturierten und unstrukturierten Informationen verstanden, die als Einheit vorliegen. Von einem elektronischen Dokument spricht man, wenn diese Einheit in einem Informationssystem gespeichert ist. Dabei spielt es keine Rolle, ob es sich um ein digitalisiertes Foto oder einen Beleg oder einen Bericht aus einem anderen System handelt.

23. Was versteht man unter Content und worin unterscheidet sich Content von Dokumenten und Daten? - Unter Content (Inhalt) versteht man Informationen, die einem Benutzer durch ein ITSystem bereitgestellt werden. -

Elektronische Dokumente sind in der Regel schwach strukturiert oder unstrukturiert. Sie sind Informationen, die zu einem gegebenen Zeitpunkt zusammenhängend, geschlossen und authentisch sind. Sie liegen in einem elektronischen System als Datei, Bestandteil einer Datei oder digitales Objekt vor.

-

Bei elektronischem Content erfolgt eine Auflösung des Dokumentes in beschreibende und strukturierende Daten sowie eine Inhaltskomponente, deren Gestalt durch die separate Struktur beschrieben ist. Die einzelnen Komponenten können unabhängig voneinander verwaltet werden und unterschiedlich aufgebaut sein.

24. Was sind Metadaten und welche Arten von Metadaten können unterschieden werden? - Metadaten sind strukturierte Informationen, die beschreiben, erklären, lokalisieren, oder es anderweitig einfacher machen, eine Informationsquelle abzurufen, zu verwenden oder zu verwalten. Daten zu bestimmten Daten oder Informationen zu bestimmten Informationen werden oft Metadaten genannt. -

Beschreibende Metadaten beschreiben eine Ressource zum Zweck ihrer Entdeckung und Identifizierung Strukturelle Metadaten, z.B. Datenmodelle und Referenzdaten Administrative Metadaten bieten Informationen zur Verwaltung einer Ressource

25. Erläutern Sie die Begriffe Repository und Data Dictionary! - generell ein Katalog mit allen Metadaten, den Definitionen, Begriffen und Darstellugsregel zu Date … Es eshreit alle Aedugsdate eies Uterehes und die Beziehungen zwischen den verschiedenen Datenobjekten mit dem Ziel einer redundanzfreien und zentralen Definition der Datenstrukturen. -

Ein aktives Data Dictionary reflektiert jederzeit den aktuellen detaillierten Stand des Datenmodells. Änderungen an der Struktur einer Datenbank können direkt erfolgen. Unabhängig davon, wie diese Änderungen erfolgen, ist die Aktualität eines aktiven Data Dictionary automatisch gewährleistet.

-

In einem passiven Data Dictionary ist diese Synchronität nicht gegeben. Änderungen an der Struktur des DBMS müssen im Data Dictionary (DD) manuell nachgepflegt werden, falls das gewünscht und wirtschaftlich möglich ist. Insbesondere DD-Produkte zur Modellierung und Dokumentation des konzeptionellen Datenmodells leiden unter dieser Problematik.

VL02 – Aufgaben des Datenmanagements

1. Was versteht man unter Master Data Management? - Stammdatenmanagement 2. Worin unterscheiden sich die Nukleus-Daten eines Unternehmens von Big Data? - Nukleus: Kundenstamm, Produktstamm - Big Data: Tweets, Social Media, Streams, Sensordaten 3. Erläutern Sie den Daten-Problemkreis!

4. Was versteht man unter Datenmanagement und welche Aufgaben werden heute damit verbunden? - Diebstahl verhindern, Zugriffsrechte, Backups anfertigen, Archivierung, Speicherplatzmanagement, Datenqualität, Digitalisierung

5. Wie hat sich die Ro...


Similar Free PDFs