Paper TSI Chapter 5 - DATA AND KNOWLEDGE MANAGEMENT Kel. Picasso PDF

Title Paper TSI Chapter 5 - DATA AND KNOWLEDGE MANAGEMENT Kel. Picasso
Course Teknologi dan SIstem Informasi
Institution Trisakti School of Management
Pages 16
File Size 206.3 KB
File Type PDF
Total Downloads 607
Total Views 810

Summary

Kelompok Picasso :201960170 Kristin201960171 Richard Randy Hayashi201960172 Riska Priyani201960173 Meiliea201960180 Siti AmirohChapter 5DATA AND KNOWLEDGE MANAGEMENT5 Managing Data (page 104)Semua aplikasi TI membutuhkan data. Data ini harus berkualitas tinggi, artinya harus akurat, lengkap, tepat w...


Description

Kelompok Picasso : 201960170 Kristin 201960171 Richard Randy Hayashi 201960172 Riska Priyani 201960173 Meiliea 201960180 Siti Amiroh

Chapter 5 DATA AND KNOWLEDGE MANAGEMENT

5.1 Managing Data (page 104) Semua aplikasi TI membutuhkan data. Data ini harus berkualitas tinggi, artinya harus akurat, lengkap, tepat waktu, konsisten, dapat diakses, relevan, dan ringkas. Sayangnya, proses memperoleh, menyimpan, dan mengelola data menjadi semakin sulit. Kesulitan Mengelola Data Karena data diproses dalam beberapa tahap dan seringkali di beberapa lokasi, data tersebut sering kali menghadapi masalah dan kesulitan. Mengelola data dalam organisasi sulit karena berbagai alasan. Pertama, jumlah data meningkat secara eksponensial seiring waktu. Banyak data historis harus disimpan untuk waktu yang lama, dan data baru ditambahkan dengan cepat. Misalnya, untuk mendukung jutaan pelanggan, pengecer besar seperti Walmart harus mengelola data berukuran petabyte. (Petabyte berukuran sekitar 1.000 terabyte, atau triliunan byte). Selain itu, data juga tersebar di seluruh organisasi, dan dikumpulkan oleh banyak individu dengan menggunakan berbagai metode dan perangkat. Data ini sering disimpan di berbagai server dan lokasi dan dalam sistem komputasi, database, format, dan bahasa manusia dan komputer yang berbeda. Masalah lainnya adalah bahwa data dihasilkan dari berbagai sumber: sumber internal (misalnya, database perusahaan dan dokumen perusahaan), sumber pribadi (misalnya, pemikiran pribadi, pendapat, dan pengalaman), dan sumber eksternal (misalnya, database komersial, laporan pemerintah, dan situs Web perusahaan). Data juga berasal dari Web, dalam bentuk data clickstream. Data clickstream adalah data yang dihasilkan pengunjung dan pelanggan ketika mereka mengunjungi situs Web dan mengklik hyperlink (dijelaskan di Bab 4). Data clickstream menyediakan jejak aktivitas pengguna di situs Web, termasuk perilaku pengguna dan pola penjelajahan. Menambah masalah ini adalah fakta bahwa sumber data baru, seperti blog, podcast, videocast, dan tag identifikasi frekuensi radio (RFID) dan sensor nirkabel lainnya, terus dikembangkan. Selain itu, data menurun seiring waktu. Misalnya, pelanggan pindah ke

alamat baru atau mengubah nama mereka, perusahaan bangkrut atau dibeli, produk baru dikembangkan, karyawan dipekerjakan atau dipecat, dan perusahaan berkembang ke negaranegara baru. Data juga tunduk pada pembusukan data (data rot). Pembusukan data terutama mengacu pada masalah dengan media tempat data disimpan. Seiring waktu, suhu, kelembapan, dan paparan cahaya dapat menyebabkan masalah fisik pada media penyimpanan dan menyulitkan akses data. Aspek kedua dari pembusukan data adalah sulitnya menemukan mesin yang diperlukan untuk mengakses data. Misalnya, saat ini hampir tidak mungkin menemukan pemain 8 trek. Akibatnya, perpustakaan kaset 8-trek menjadi relatif tidak berharga, kecuali Anda memiliki pemutar 8-trek yang berfungsi atau Anda mengonversi kaset ke media modern seperti CD. Keamanan, kualitas, dan integritas data sangat penting, namun mudah terancam. Selain itu, persyaratan hukum yang berkaitan dengan data berbeda di antara negara dan industri, dan sering berubah. Masalah lain muncul dari kenyataan bahwa, dari waktu ke waktu, organisasi telah mengembangkan sistem informasi untuk proses bisnis tertentu, seperti pemrosesan transaksi, manajemen rantai pasokan, dan manajemen hubungan pelanggan. Sistem informasi yang secara khusus mendukung proses ini memberlakukan persyaratan unik pada data, yang mengakibatkan pengulangan dan konflik di seluruh organisasi. Misalnya, fungsi pemasaran mungkin menyimpan informasi tentang pelanggan, wilayah penjualan, dan pasar. Data ini mungkin digandakan dalam fungsi penagihan atau layanan pelanggan. Situasi ini dapat menghasilkan data yang tidak konsisten di dalam perusahaan. Data yang tidak konsisten mencegah perusahaan mengembangkan pandangan terpadu dari informasi bisnis inti — data mengenai pelanggan, produk, keuangan, dan sebagainya — di seluruh organisasi dan sistem informasinya. Dua faktor lain mempersulit pengelolaan data. Pertama, peraturan federal (misalnya, SarbanesOxley) telah menjadikannya sebagai prioritas utama bagi perusahaan untuk mempertanggungjawabkan cara mereka mengelola informasi dengan lebih baik. SarbanesOxley mensyaratkan bahwa (1) perusahaan publik mengevaluasi dan mengungkapkan efektivitas pengendalian keuangan internal mereka dan (2) auditor independen untuk perusahaan tersebut menyetujui pengungkapan ini. Undang-undang juga menyatakan bahwa CEO dan CFO secara pribadi bertanggung jawab atas pengungkapan tersebut. Jika perusahaan mereka tidak memiliki kebijakan manajemen data yang memuaskan dan penipuan atau pelanggaran keamanan terjadi, pejabat perusahaan dapat ditahan dan menghadapi tuntutan. Kedua, perusahaan tenggelam dalam data, yang kebanyakan tidak terstruktur. Seperti yang Anda lihat, jumlah data meningkat secara eksponensial. Agar menguntungkan, perusahaan harus mengembangkan strategi untuk mengelola data ini secara efektif.

Tata Kelola Data Untuk mengatasi berbagai masalah yang terkait dengan pengelolaan data, organisasi beralih ke tata kelola data. Tata kelola data adalah pendekatan untuk mengelola informasi di seluruh

organisasi. Ini melibatkan serangkaian proses bisnis dan kebijakan formal yang dirancang untuk memastikan bahwa data ditangani dengan cara tertentu yang terdefinisi dengan baik. Artinya, organisasi mengikuti aturan yang tidak ambigu untuk membuat, mengumpulkan, menangani, dan melindungi informasinya. Tujuannya adalah untuk membuat informasi tersedia, transparan, dan berguna bagi orang-orang yang berwenang untuk mengaksesnya, dari saat ia memasuki organisasi hingga menjadi usang dan dihapus. Salah satu strategi penerapan tata kelola data adalah pengelolaan data induk. Manajemen data master (master data management) adalah proses yang mencakup semua proses bisnis dan aplikasi organisasi. Ini memberi perusahaan kemampuan untuk menyimpan, memelihara, bertukar, dan menyinkronkan "versi tunggal kebenaran" yang konsisten, akurat, dan tepat waktu untuk data master perusahaan. Master data adalah sekumpulan data inti, seperti pelanggan, produk, karyawan, vendor, lokasi geografis, dan seterusnya, yang menjangkau sistem informasi perusahaan. Penting untuk membedakan antara data master dan data transaksi. Data transaksi, yang dihasilkan dan ditangkap oleh sistem operasional, menggambarkan aktivitas bisnis, atau transaksi. Sebaliknya, data master diterapkan ke beberapa transaksi dan digunakan untuk mengkategorikan, menggabungkan, dan mengevaluasi data transaksi.

5.2 Big Data (page 106) Kami mengumpulkan data dan informasi dengan kecepatan yang semakin tinggi dari berbagai sumber seperti dokumen perusahaan, email, halaman Web, gesekan kartu kredit, pesan telepon, perdagangan saham, memo, buku alamat, dan pemindaian radiologi. Sumber data dan informasi baru termasuk blog, podcast, videocast (pikirkan YouTube), pengawasan video digital, dan tag RFID serta sensor nirkabel lainnya (dibahas dalam Bab 8). Faktanya, organisasi menangkap data tentang hampir semua peristiwa termasuk peristiwa yang, di masa lalu, perusahaan tidak pernah anggap sebagai data sama sekali, seperti lokasi seseorang, getaran dan suhu mesin, atau tekanan di banyak titik. di jembatan — dan kemudian menganalisis data tersebut. Organisasi dan individu harus memproses data dalam jumlah besar yang tak terbayangkan yang tumbuh semakin pesat. Menurut IDC (sebuah firma riset teknologi), dunia menghasilkan exabyte data setiap tahun (satu exabyte adalah satu triliun terabyte). Selain itu, jumlah data yang diproduksi di seluruh dunia meningkat 50 persen setiap tahun. Seperti yang telah kita bahas di awal bab, kita mengacu pada superabundance data yang tersedia saat ini sebagai Big Data. (Kami memanfaatkan Big Data untuk membedakan istilah dari data tradisional dalam jumlah besar.) Kami memiliki banyak data yang harus kami pahami dan kelola. Untuk menghadapi pertumbuhan dan keragaman sifat data digital, organisasi harus menggunakan teknik yang canggih untuk pengelolaan data. Intinya, Big Data adalah tentang prediksi. Prediksi tidak datang dari "teaching" komputer untuk "think" seperti manusia. Sebaliknya, prediksi datang dari penerapan matematika ke sejumlah besar data untuk menyimpulkan probabilitas. Pertimbangkan contoh-contoh ini: • •

Kemungkinan sebuah pesan email adalah spam; Kemungkinan huruf “teh” yang diketik seharusnya menjadi “the”;



Kemungkinan lintasan dan kecepatan orang yang sedang menyeberang menunjukkan bahwa ia akan menyeberang jalan tepat waktu — artinya mobil yang dapat mengemudi sendiri hanya perlu sedikit melambat.

Sistem Big Data berkinerja baik karena berisi data dalam jumlah besar yang menjadi dasar prediksi mereka. Selain itu, mereka dikonfigurasi untuk meningkatkan diri dari waktu ke waktu dengan mencari sinyal dan pola yang paling berharga karena lebih banyak data yang dimasukkan. Mendefinisikan Big Data Sulit untuk mendefinisikan Big Data. Di sini kami menyajikan dua gambaran tentang fenomena tersebut. Pertama, firma riset teknologi Gartner (www.gartner.com) mendefinisikan Big Data sebagai aset informasi yang beragam, bervolume tinggi, dan berkecepatan tinggi yang memerlukan bentuk pemrosesan baru untuk memungkinkan pengambilan keputusan yang ditingkatkan, penemuan wawasan, dan pengoptimalan proses. Kedua, Big Data Institute (TBDI; www.the bigdatainstitute.com) mendefinisikan Big Data sebagai kumpulan data besar yang: • • • • •

Tunjukkan variasi; Sertakan data terstruktur, tidak terstruktur, dan semi-terstruktur; Dibangkitkan dengan kecepatan tinggi dengan pola yang tidak pasti; Jangan cocok dengan database tradisional, terstruktur, dan relasional (dibahas nanti dalam bab ini); Dapat ditangkap, diproses, diubah, dan dianalisis dalam jumlah waktu yang wajar hanya dengan sistem informasi yang canggih.

Big Data umumnya terdiri dari berikut ini. Ingatlah bahwa daftar ini tidak inklusif. Ini akan meluas saat sumber data baru muncul. •



• •

Data perusahaan tradisional — contohnya adalah informasi pelanggan dari sistem manajemen hubungan pelanggan, data perencanaan sumber daya perusahaan transaksional, transaksi toko Web, data operasi, dan data buku besar umum. Data yang dihasilkan mesin / sensor — contohnya adalah pengukur pintar; sensor manufaktur; sensor yang diintegrasikan ke dalam telepon pintar, mobil, mesin pesawat, dan mesin industri; log peralatan; dan data sistem perdagangan. Data sosial — contohnya adalah komentar umpan balik pelanggan; situs mikroblog seperti Twitter; dan situs media sosial seperti Facebook, YouTube, dan LinkedIn. Gambar diambil oleh miliaran perangkat yang berlokasi di seluruh dunia, dari kamera digital dan telepon kamera hingga pemindai medis dan kamera keamanan.

Mari kita lihat beberapa contoh spesifik dari Big Data: •

Ketika Sloan Digital Sky Survey di New Mexico diluncurkan pada tahun 2000, teleskopnya mengumpulkan lebih banyak data dalam beberapa minggu pertama daripada yang telah dikumpulkan sepanjang sejarah astronomi. Pada 2013, arsip survei berisi ratusan terabyte data. Namun, Teleskop Survei Sinoptik Besar di Chili,

• •

• • •

yang akan online pada tahun 2016, akan mengumpulkan data sebanyak itu setiap lima hari. Pada tahun 2013, Google memproses lebih dari 24 petabyte data setiap hari. Anggota Facebook mengunggah lebih dari 10 juta foto baru setiap jam. Selain itu, mereka mengklik tombol "suka" atau memberikan komentar hampir 3 miliar kali setiap hari. 800 juta pengguna bulanan layanan YouTube Google mengupload lebih dari satu jam video setiap detik. Jumlah pesan di Twitter tumbuh 200 persen setiap tahun. Pada pertengahan 2013, volumenya melebihi 450 juta tweet per hari. Baru-baru ini pada tahun 2000, hanya 25 persen dari informasi yang disimpan di dunia adalah digital. 75 persen lainnya adalah analog; artinya, disimpan di atas kertas, film, piringan hitam, dan sejenisnya. Pada 2013, jumlah informasi yang disimpan di dunia diperkirakan sekitar 1.200 exabyte, di mana kurang dari 2 persennya adalah non-digital.

Karakteristik Big Data Big Data memiliki tiga karakteristik berbeda: volume, kecepatan, dan variasi. Karakteristik ini membedakan Big Data dari data tradisional. 





Volume : Kami telah mencatat volume Big Data yang luar biasa di bab ini. Meskipun volume Big Data yang besar menimbulkan masalah manajemen data, volume ini juga membuat Big Data sangat berharga. Terlepas dari sumber, struktur, format, dan frekuensinya, data selalu berharga. Jika jenis data tertentu tampaknya tidak memiliki nilai saat ini, itu karena kami belum dapat menganalisisnya secara efektif. Misalnya, beberapa tahun lalu ketika Google mulai memanfaatkan citra satelit, menangkap tampilan jalan, dan kemudian membagikan data geografis ini secara gratis, hanya sedikit orang yang memahami nilainya. Saat ini, kami menyadari bahwa data tersebut sangat berguna (misalnya, pertimbangkan berbagai kegunaan Google Maps). Pertimbangkan data yang dihasilkan mesin, yang dihasilkan dalam jumlah yang jauh lebih besar daripada data non-tradisional. Misalnya, sensor dalam satu mesin jet dapat menghasilkan 10 terabyte data dalam 30 menit. Dengan lebih dari 25.000 penerbangan maskapai per hari, volume data harian hanya dari satu sumber ini luar biasa. Pengukur kelistrikan pintar, sensor di peralatan industri berat, dan telemetri dari mobil meningkatkan volume Big Data. Felocity : Laju aliran data ke dalam organisasi meningkat pesat. Kecepatan sangat penting karena meningkatkan kecepatan putaran umpan balik antara perusahaan dan pelanggannya. Misalnya, Internet dan teknologi seluler memungkinkan pengecer online untuk mengumpulkan riwayat tidak hanya pada penjualan akhir, tetapi juga pada setiap klik dan interaksi pelanggan mereka. Perusahaan yang dapat dengan cepat memanfaatkan informasi tersebut — misalnya, dengan merekomendasikan pembelian tambahan — mendapatkan keunggulan kompetitif. Variety : Format data tradisional cenderung terstruktur, dijelaskan dengan relatif baik, dan berubah perlahan. Data tradisional meliputi data pasar keuangan, transaksi pointof-sale, dan banyak lagi. Sebaliknya, format Big Data berubah dengan cepat. Mereka

termasuk citra satelit, aliran audio siaran, file musik digital, konten halaman web, pindaian dokumen pemerintah, dan komentar yang diposting di jejaring sosial. Mengelola Big Data Langkah pertama bagi banyak organisasi untuk mengelola Big Data adalah mengintegrasikan silo informasi ke dalam lingkungan database dan kemudian mengembangkan gudang data untuk pengambilan keputusan. Setelah menyelesaikan langkah ini, banyak organisasi mengalihkan perhatian mereka ke bisnis manajemen informasi — memahami data mereka yang berkembang biak. Dalam beberapa tahun terakhir, Oracle, IBM, Microsoft, dan SAP telah menghabiskan miliaran dolar untuk membeli perusahaan perangkat lunak yang berspesialisasi dalam manajemen data dan intelijen bisnis. Selain itu, banyak organisasi beralih ke database NoSQL (anggaplah mereka sebagai database "tidak hanya SQL") untuk memproses Big Data. Database ini memberikan alternatif bagi perusahaan yang memiliki lebih banyak jenis data (Big Data) selain data terstruktur tradisional yang sesuai dengan baik ke dalam baris dan kolom database relasional. Seperti yang akan Anda lihat nanti di bab ini, database relasional tradisional seperti Oracle dan MySQL menyimpan data dalam tabel yang diatur ke dalam baris dan kolom. Setiap baris dikaitkan dengan catatan unik, misalnya akun pelanggan, dan setiap kolom dikaitkan dengan bidang yang menentukan atribut akun itu (misalnya, nama pelanggan, nomor identifikasi pelanggan, alamat pelanggan, dll.). Sebaliknya, database NoSQL dapat memanipulasi data terstruktur serta tidak terstruktur dan data yang tidak konsisten atau hilang. Karena alasan ini, database NoSQL sangat berguna saat bekerja dengan Big Data. Memanfaatkan Big Data Organisasi harus melakukan lebih dari sekadar mengelola Big Data; mereka juga harus mendapatkan nilai darinya. Secara umum, ada enam cara yang dapat diterapkan secara luas untuk memanfaatkan Big Data untuk mendapatkan nilai. 



Menciptakan Transparansi. Hanya membuat Big Data lebih mudah diakses oleh pemangku kepentingan terkait secara tepat waktu dapat menciptakan nilai bisnis yang luar biasa. Di sektor publik, misalnya, membuat data yang relevan lebih mudah diakses di seluruh departemen yang terpisah dapat secara tajam mengurangi waktu pencarian dan pemrosesan. Di bidang manufaktur, mengintegrasikan data dari R&D, rekayasa, dan unit manufaktur untuk memungkinkan rekayasa serentak dapat secara signifikan mengurangi waktu ke pasar dan meningkatkan kualitas. Mengaktifkan Eksperimen. Eksperimen memungkinkan organisasi menemukan kebutuhan dan meningkatkan kinerja. Saat organisasi membuat dan menyimpan lebih banyak data dalam bentuk digital, mereka dapat mengumpulkan data kinerja yang lebih akurat dan terperinci (secara real-time atau hampir real-time) tentang segala hal mulai dari inventaris produk hingga hari sakit personel. TI memungkinkan organisasi untuk menyiapkan eksperimen terkontrol. Misalnya, Amazon terus-menerus bereksperimen dengan menawarkan "looks" yang sedikit berbeda di situs Web-nya. Eksperimen ini disebut eksperimen A / B, karena









setiap eksperimen hanya memiliki dua kemungkinan hasil. Berikut adalah cara kerja percobaan: Ratusan ribu orang yang mengklik Amazon.com akan melihat satu versi situs Web, dan ratusan ribu lainnya akan melihat versi lainnya. Satu eksperimen mungkin mengubah lokasi tombol "buy" di halaman Web. Orang lain mungkin mengubah ukuran font tertentu di halaman Web. (Amazon melakukan ratusan percobaan A / B saat mengevaluasi halaman Web-nya.) Amazon menangkap data pada bermacam-macam variabel dari semua klik, termasuk halaman mana yang dikunjungi pengguna, waktu yang mereka habiskan di setiap halaman, dan apakah klik mengarah untuk membeli. Ia kemudian menganalisis semua data ini untuk "tweak" situs Webnya untuk memberikan pengalaman pengguna yang optimal. Menyegmentasi Populasi untuk Menyesuaikan Tindakan. Big Data memungkinkan organisasi untuk membuat segmentasi pelanggan yang didefinisikan secara sempit dan untuk menyesuaikan produk dan layanan untuk secara tepat memenuhi kebutuhan pelanggan. Misalnya, perusahaan dapat melakukan segmentasi mikro terhadap pelanggan secara real time untuk secara tepat menargetkan promosi dan iklan. Misalkan, misalnya, sebuah perusahaan mengetahui Anda berada di salah satu tokonya, mempertimbangkan produk tertentu (Mereka dapat memperoleh informasi ini dari ponsel cerdas Anda, dari kamera di dalam toko, dan dari perangkat lunak pengenal wajah.) Mereka dapat mengirim kupon secara langsung ke ponsel Anda menawarkan diskon 10 persen jika Anda membeli produk dalam lima menit ke depan. Mengganti / Mendukung Pengambilan Keputusan Manusia dengan Algoritma Otomatis. Analisis yang canggih dapat secara substansial meningkatkan pengambilan keputusan, meminimalkan risiko, dan menggali wawasan yang berharga. Misalnya, agen pajak menggunakan alat perangkat lunak analisis risiko otomatis untuk mengidentifikasi pengembalian pajak yang menjamin pemeriksaan lebih lanjut, dan pengecer dapat menggunakan algoritme untuk menyempurnakan inventaris dan penetapan harga sebagai respons terhadap penjualan di toko dan online secara waktu nyata. Inovasi Model, Produk, dan Layanan Bisnis Baru. Big Data memungkinkan perusahaan membuat produk dan layanan baru, menyempurnakan yang sudah ada, dan menciptakan model bisnis yang sama sekali baru. Misalnya, produsen memanfaatkan data yang diperoleh dari penggunaan produk aktual untuk meningkatkan pengembangan produk generasi berikutnya dan untuk menciptakan penawaran layanan purna jual yang inovatif. Munculnya data lokasi waktu nyata telah menciptakan rangkaian layanan berbasis lokasi yang sama sekali baru mulai dari navigasi hingga penetapan harga properti dan asuransi kecelakaan berdasarkan di mana, dan bagaimana, orang-orang mengendarai mobil mereka. Organisasi Dapat Menganal...


Similar Free PDFs