PEMROSESAN FILE DAN KONSEP MANAJEMEN
DATA
9.1. Tinjauan sekilas tentang teknologi
A.Field, Unsur Data, Atribut, dan Elemen- Elemen
Istilah- istilah field, unsur data, atribut, dan elemen digunakan secara bergantian untuk menyebutkan blok data terkecil yang disimpan dan digunakan dalam sistem informasi. Field dapat terdiri atas karakter tunggal atau nomor tunggal, atau dapat terdiri dari beberapa karakter atau nomor.
Contoh- contoh field adalah :
1. Nama pelanggan
2. Nomor tunjangan sosial karyawan
3. Nomor pesanan pembelian
Field biasanya secara logis berkaitan dengan field lainnya;
pengelompokan logis atas field disebut catatan (record).
Istilah- istilah field, unsur data, atribut, dan elemen digunakan secara bergantian untuk menyebutkan blok data terkecil yang disimpan dan digunakan dalam sistem informasi. Field dapat terdiri atas karakter tunggal atau nomor tunggal, atau dapat terdiri dari beberapa karakter atau nomor.
Contoh- contoh field adalah :
1. Nama pelanggan
2. Nomor tunjangan sosial karyawan
3. Nomor pesanan pembelian
Field biasanya secara logis berkaitan dengan field lainnya;
pengelompokan logis atas field disebut catatan (record).
B. Okurensi Data
Struktur catatan memiliki okurensi (occurences), yang juga disebut instances. Okurensi catatan adalah himpunan spesifik nilai- nilai data untuk catatan.
Struktur catatan memiliki okurensi (occurences), yang juga disebut instances. Okurensi catatan adalah himpunan spesifik nilai- nilai data untuk catatan.
C. Panjang Catatan- Tetap dan variabel
Catatan dalam file dapat memiliki panjang yang tetap atau variabel. Dalam catatan dengan panjang- tetap, baik jumlah field maupun panjang (ukuran karakter) setiap field adalah tetap. Sebagian besar catatan yang disimpan dalam direct access storage devices (DASDs) adalah catatan panjang- tetap. Catatan dengan panjang- variable, lebar field dapat disesuaikan untuk setiap okurensi data. Catatan penjejak adalah perluasan dari catatan master,. Catatan penjejak terpisah dari catatan master dan hanya ditulis sesuai kebutuhan. Dengan menggunakan file piutang dagang akun terbuka, sebagai contoh, catatan master memuat informasi yang umum bagi seluruh akun dan jumlah faktur yang memadai bagi sebagian besar akun, dimana catatan penjejak memuat lebih banyak faktur. Catatan master harus memiliki jumlah yang sama dengan catatan penjejak yang berkaitan sesuai kebutuhan. Catatan penjejak harus segera dituliskan setelah catatan master yang berkaitan.
Kelompok berulang adalah kelompok field yang berhubungan yang diulang dalam catatan dengan panjang variabel. Dalam diagram pohon 11.3 PART tampak sebagai Induk dari PEMASOK dan LOKASI karena setiap kemunculan PART akan menimbulkan lebih dari satu pemasok atau lokasi. Secara umum, elemen tingkat tertinggi dalam diagram pohon adalh induk; elemen dengan tingkatan lebih rendah yang tampak pada diagram pohon yanng berkaitan dengan (atau bagian dari induk disebut anak.
Catatan dalam file dapat memiliki panjang yang tetap atau variabel. Dalam catatan dengan panjang- tetap, baik jumlah field maupun panjang (ukuran karakter) setiap field adalah tetap. Sebagian besar catatan yang disimpan dalam direct access storage devices (DASDs) adalah catatan panjang- tetap. Catatan dengan panjang- variable, lebar field dapat disesuaikan untuk setiap okurensi data. Catatan penjejak adalah perluasan dari catatan master,. Catatan penjejak terpisah dari catatan master dan hanya ditulis sesuai kebutuhan. Dengan menggunakan file piutang dagang akun terbuka, sebagai contoh, catatan master memuat informasi yang umum bagi seluruh akun dan jumlah faktur yang memadai bagi sebagian besar akun, dimana catatan penjejak memuat lebih banyak faktur. Catatan master harus memiliki jumlah yang sama dengan catatan penjejak yang berkaitan sesuai kebutuhan. Catatan penjejak harus segera dituliskan setelah catatan master yang berkaitan.
Kelompok berulang adalah kelompok field yang berhubungan yang diulang dalam catatan dengan panjang variabel. Dalam diagram pohon 11.3 PART tampak sebagai Induk dari PEMASOK dan LOKASI karena setiap kemunculan PART akan menimbulkan lebih dari satu pemasok atau lokasi. Secara umum, elemen tingkat tertinggi dalam diagram pohon adalh induk; elemen dengan tingkatan lebih rendah yang tampak pada diagram pohon yanng berkaitan dengan (atau bagian dari induk disebut anak.
D. Kunci catatan dan Urutan File
Kunci atau kunci catatan merupakan unsur data atau kombinasi unsusr data yang secara unik mengidentifikasi catatan tertentu dalam file. Istilah order random relatif berkaitan dengan field dimana file tidak disortir.
Kunci atau kunci catatan merupakan unsur data atau kombinasi unsusr data yang secara unik mengidentifikasi catatan tertentu dalam file. Istilah order random relatif berkaitan dengan field dimana file tidak disortir.
9.2. Evaluasi teknologi database
1.Database, atau sering pula dieja basisdata,
adalah kumpulan informasi yang disimpan di dalam komputer secara sistematik
sehingga dapat diperiksa menggunakan suatu program komputer untuk memperoleh informasi
dari basis data tersebut. Perangkat lunak yang digunakan untuk mengelola dan
memanggil kueri (query) basis data disebut sistem manajemen
basis data (database management system, DBMS). Sistem basis
data dipelajari dalam ilmu informasi.
Sedangkan tekonologi database saat ini berkembang sangat pesat. Banyak
bentuk-bentuk yang dulu hanya mempunyai teknologi sebagai tempat penyimpanan
data yang terdiri dari dari field, record, dan diolah serta ditampilkan menjadi
informasi dalam berbagai format tampilan yang sederhana tersebut maka
didapatkan suatu metoda untuk menampilkan suatu database yang berguna untuk
menganalisa data untuk suatu keperluan tertentu.
Dengan memanfaatkan relational database yang sudah ada maka didapat satu
cara untuk mengantisipasi kebutuhan guna menganalisa data secara cepat untuk
membantu mendapatkan keputusan dalam suatu aplikasi atau organisasi.
Salah satu contoh teknologi database
Saat ini adalah dimana seorang design web dapat membuat web dengan menarik
karena sudah ada teknologi database generasi baru ysng biasa disebut orade.
Dengan orade inilah para pendesign web biasa membuat
web dengan penuh keunikan.
Dan yang dimaksud dengan software database adalah merupakan aplikasi
perangkat lunak yang diguakan oleh user untuk mengelola dan memanggil database
tersebut. Pengelola dan pemanggil kuery ( query )
basis data tersebut dengan system manajemen basis data. Perangkat lunak basis
data yang sering digunakan dalam pemrograman dan merupakan perangkat basis data
aras tinggi (high level).
2.Pengertian database dari sisi pelaku bisnis adalah sebagai teknologi yang
bermanfaat untuk menghemat waktu dan biaya karena dengan database yang
terkomputerisasi kita bisa banyak menyimpan informasi seperti mencetak, memuat,
menampilkan data yang akurat, memudahkan pengaksesan data, mengisolasi data
untuk di standarisasikan, mengurangi redundasi data dan inkonsistensi. Jika
menggunakan penyimpanan data secara relational file dapat menyebabkan hilangnya
data yang di butuhkan, data yang tidak konsisten, proses update yang lambat dan
lain-lain.
9.3. Sistem Manajemen database dan arsitekturnya.
Pada gambar 11.5 terdapat tiga tingkatan arsitektur yang relevan dengan
database dan manajemen database; arsitektur tingkat konseptual, arsitektur
tingkat logis, dan arsitektur tingkat fisik. Pada tingkat konseptual, database
merupakan kumpulan beragam elemen informasi yang akan digunakan untuk tujuan-
tujuan yang telah dipilih. Catatan dan field- field dalam database
distrukturkan dan diorganisasikan dalam beberapa pola logis, sehingga membantu
pembentukan struktur data logis. Terdapat tiga jenis struktur data logis yang
dapat digunakan untuk mencapai tujuan tersebut, yaitu : hirarkis, jaringan, dan
relasional.
A. Arsitektur Konseptual
Model data hubungan entitas- entity relationship (ER) merupakan pendeketan yang populer. Model ER menggambarkan hubungan antar segmen secara sederhana. Terdapat pula metode- metode konseptual lainnya, termasuk teknik pembuatan model berorientasi-obyek-object-oriented modeling technique (OMT), yang pada dasarnya dikembangkan untuk pemrograman berorientasi- obyek dan diadaptasi untuk pembuatan model Blaha, Premerlani, dan Rumbaugh. Kelas obyek berkaitan dengan segmen, dan obyek berkaitan dengan bagian tertentu.
Model data hubungan entitas- entity relationship (ER) merupakan pendeketan yang populer. Model ER menggambarkan hubungan antar segmen secara sederhana. Terdapat pula metode- metode konseptual lainnya, termasuk teknik pembuatan model berorientasi-obyek-object-oriented modeling technique (OMT), yang pada dasarnya dikembangkan untuk pemrograman berorientasi- obyek dan diadaptasi untuk pembuatan model Blaha, Premerlani, dan Rumbaugh. Kelas obyek berkaitan dengan segmen, dan obyek berkaitan dengan bagian tertentu.
B. Arsitektur Database pada Tingkat Logis : Struktur Database Logis
Hubungan- hubungan yang timbul antara segmen- segmen dalam database ditentukan oleh struktur data logis, yang juga disebut skema atau model database. Tiga model utama struktur data logis yang ada dalam literatur adalah :
1. Model pohon atau hirarkis
2. Model jaringan
3. Model relasional
Hubungan- hubungan yang timbul antara segmen- segmen dalam database ditentukan oleh struktur data logis, yang juga disebut skema atau model database. Tiga model utama struktur data logis yang ada dalam literatur adalah :
1. Model pohon atau hirarkis
2. Model jaringan
3. Model relasional
Penjelasannya :
1. Model pohon atau hirarkis
Struktur pohon merupakan representasi langsung proses segmentasi yang telah di jelaskan sebelumnya.Dalam struktur pohon,setiap simpul mewakili himpunan field(misalnya,segmen),dan simpul berkaitan dengan node lain yang tingkatanya lebih tinggi dalam struktur pohon.Simpul yang lebih tinggi disebut simpul induk.Hubungan antara induk dan anak di sebut cabang.
Struktur pohon merupakan representasi langsung proses segmentasi yang telah di jelaskan sebelumnya.Dalam struktur pohon,setiap simpul mewakili himpunan field(misalnya,segmen),dan simpul berkaitan dengan node lain yang tingkatanya lebih tinggi dalam struktur pohon.Simpul yang lebih tinggi disebut simpul induk.Hubungan antara induk dan anak di sebut cabang.
2. Struktur jaringan
Struktur jaringan memungkinkan segmen anak memiliki lebih dari satu induk.struktur pohon dan jaringan keduanya diterapkan dengan penunjuk field(field pointer),dengan segmen lintas-hubung,seperti yang akan di bahas lebih jauh dalam bagian berikutnya.
Struktur jaringan memungkinkan segmen anak memiliki lebih dari satu induk.struktur pohon dan jaringan keduanya diterapkan dengan penunjuk field(field pointer),dengan segmen lintas-hubung,seperti yang akan di bahas lebih jauh dalam bagian berikutnya.
3. Implementasi struktur-struktur pohon dan jaringan
Topik implementasi srtuktur-struktur pohon dan jaringan lebih merupakan bagian dari arsitektur fisik database di bandingkan sebagai arsitektur logis.Dalam organisasi daftar,setiap catatan memuat satu atau lebihponter(field)yang mengindikasikan alamat catatan logis berikutnya yang memiliki atribut yang sama.Catatan dapat merupakan bagian dari beberapa daftar.Daftar ini disebut organisasi multydaftar.
Dua area aplikasi sistem berdasar penunjuk field yang paling berkrmbang adalah hiperteks dan jaringan data semantik.
Topik implementasi srtuktur-struktur pohon dan jaringan lebih merupakan bagian dari arsitektur fisik database di bandingkan sebagai arsitektur logis.Dalam organisasi daftar,setiap catatan memuat satu atau lebihponter(field)yang mengindikasikan alamat catatan logis berikutnya yang memiliki atribut yang sama.Catatan dapat merupakan bagian dari beberapa daftar.Daftar ini disebut organisasi multydaftar.
Dua area aplikasi sistem berdasar penunjuk field yang paling berkrmbang adalah hiperteks dan jaringan data semantik.
4. Struktur data relasional
Model relasional memandang database sebagai kumpulan dua tabel dimensional dibandingkan sebagai struktur jenis hirarkis atau jaringan.Aturan-aturan tertentu di sebut format-format normal mengatur pembuatan tabel-tabel.ketiga format normal adalah sebagai berikut:
Format normal Aturan
Format normal pertama Membagi tabel untuk mengeliminasi kelompok berulang
Format normal kedua Membagi tabel sehingga tidak ada kunci yang memntukan nilai field non-kunci.
Model relasional memandang database sebagai kumpulan dua tabel dimensional dibandingkan sebagai struktur jenis hirarkis atau jaringan.Aturan-aturan tertentu di sebut format-format normal mengatur pembuatan tabel-tabel.ketiga format normal adalah sebagai berikut:
Format normal Aturan
Format normal pertama Membagi tabel untuk mengeliminasi kelompok berulang
Format normal kedua Membagi tabel sehingga tidak ada kunci yang memntukan nilai field non-kunci.
Format normal ketiga Membagi tabel sehingga tidak ada field non- kunci yang
menentukan nilai field non- kunci lainnya.
C. Arsitektur database pada tingkat fisik
Dalam pembahasan tingkat fisik arsitektur database,kita akan berfokus pada tiga metode akses file:Sekuensial,Terindeks,langsung.
Dalam pembahasan tingkat fisik arsitektur database,kita akan berfokus pada tiga metode akses file:Sekuensial,Terindeks,langsung.
1. File terakses secara sekuensial
Dalam file akses sekuensial,catatan-catatan hanya dapat di akses dalam sekuens yang telah di tentukan sebelumnya.organisasi file sekuensial bukan merupakan alat sortir data yang bermanfaat jika hanya terdapat sedikit saja catatan yang akan di akses dalam file yang memuat banyak catatan.file sekuensial bermanfaat dalam pemrosesan batch,secara normal mengakses seluruh catatan dalam file.kesimpulannya,organisasi file sekuensial bermanfaat jika di butuhkan pemrosesan batch.
Dalam file akses sekuensial,catatan-catatan hanya dapat di akses dalam sekuens yang telah di tentukan sebelumnya.organisasi file sekuensial bukan merupakan alat sortir data yang bermanfaat jika hanya terdapat sedikit saja catatan yang akan di akses dalam file yang memuat banyak catatan.file sekuensial bermanfaat dalam pemrosesan batch,secara normal mengakses seluruh catatan dalam file.kesimpulannya,organisasi file sekuensial bermanfaat jika di butuhkan pemrosesan batch.
2. File terindeks
Setiap atribut dapat di ekstrak dari catatan dalam file utama dan di gunakan untuk membuat file baru yang bertujuan menyediakan indeks untuk file asli.File seperti itu di sebut file terindeks atau file terinversi.File dikatakan terinversi secara penuh jika ada indeks untuk seluruh fieldnya.File sekuensial terindeks adalah file sekuensial yang tersimpan dalam DASD dan di indeks serta di sortir secara fisik dalam field yang sama.File-file tersebut umumnya berhubungan dengan file ISAM,dimana ISAM berlaku sebagai kontraksi metode akses sekuensial terindeks.Area utama(primer)merupakan bagian dari disk dimana catatan-catatan aktual di tulis.area tambahan merupakan bagian terpisah dari disk yang di lokasikan bagi file untuk memuat tambahan yang di buat,tanpa melakukan pemrosesan ekstensif terhadap file awal.
Setiap atribut dapat di ekstrak dari catatan dalam file utama dan di gunakan untuk membuat file baru yang bertujuan menyediakan indeks untuk file asli.File seperti itu di sebut file terindeks atau file terinversi.File dikatakan terinversi secara penuh jika ada indeks untuk seluruh fieldnya.File sekuensial terindeks adalah file sekuensial yang tersimpan dalam DASD dan di indeks serta di sortir secara fisik dalam field yang sama.File-file tersebut umumnya berhubungan dengan file ISAM,dimana ISAM berlaku sebagai kontraksi metode akses sekuensial terindeks.Area utama(primer)merupakan bagian dari disk dimana catatan-catatan aktual di tulis.area tambahan merupakan bagian terpisah dari disk yang di lokasikan bagi file untuk memuat tambahan yang di buat,tanpa melakukan pemrosesan ekstensif terhadap file awal.
3. File terakses secara langsung
File terakses secara langsung memungkinkan catatan-catatan individual dapat di panggil secara cepat tanpa menggunakan indeks.Tranformasi random merupakan metode penyimpanan dan penempatan catatan dalam file akses langsung yang di gunakan secara luas.jadi istilah akses random sering kali di gunakan sebagai sinonim dari akses langsung.
File terakses secara langsung memungkinkan catatan-catatan individual dapat di panggil secara cepat tanpa menggunakan indeks.Tranformasi random merupakan metode penyimpanan dan penempatan catatan dalam file akses langsung yang di gunakan secara luas.jadi istilah akses random sering kali di gunakan sebagai sinonim dari akses langsung.
D. Hubungan ekonomik antar teknik-teknik organisasi file
Teknik-teknik akses file yang telah di bahas(sekuensial,terindeks,dan akses langsung) cocok untuk situasi-situasi yang berbeda.gambar 11.18 mengiktisarkan kapan masing-masing teknik organisasi file di gunakan.aspek ekonomik pemrosesan file sangat ditentukan oleh rasio aktifitas(jumlah catatan-catatan yang di akses dibagi dengan jumlah catatan dalam file),dan waktu yang dibutuhkan untuk pemrosesan dan inquiri.
Teknik-teknik akses file yang telah di bahas(sekuensial,terindeks,dan akses langsung) cocok untuk situasi-situasi yang berbeda.gambar 11.18 mengiktisarkan kapan masing-masing teknik organisasi file di gunakan.aspek ekonomik pemrosesan file sangat ditentukan oleh rasio aktifitas(jumlah catatan-catatan yang di akses dibagi dengan jumlah catatan dalam file),dan waktu yang dibutuhkan untuk pemrosesan dan inquiri.
Teknik-Teknik organisasi file Saat terbaik Keterbatasan
Sekuensial Rasio aktifitas tinggi,seperti dalam pemrosesan batch Tidak memungkinkan untuk mengakses catatan tunggal secara cepat
Terindeks Rasio aktifitas rendah,ukuran file dari moderat sampai tinggi Pemutakhiran file membutuhkan pemutakhiran indeks-indeks
Sekuensial terindeks File harus di proses dengan pola pemrosesan batch(rasio aktifitas tinggi) dan non batch(rasio aktifitas rendah) Sama dengan sekuensial dan terindeks
Langsung Rasio aktifitas rendah,file berukuran rendah,struktur jaringan,dan struktur pohon Memerlukan kunci-kunci untuk menempatkan catatan-catatan
Sekuensial Rasio aktifitas tinggi,seperti dalam pemrosesan batch Tidak memungkinkan untuk mengakses catatan tunggal secara cepat
Terindeks Rasio aktifitas rendah,ukuran file dari moderat sampai tinggi Pemutakhiran file membutuhkan pemutakhiran indeks-indeks
Sekuensial terindeks File harus di proses dengan pola pemrosesan batch(rasio aktifitas tinggi) dan non batch(rasio aktifitas rendah) Sama dengan sekuensial dan terindeks
Langsung Rasio aktifitas rendah,file berukuran rendah,struktur jaringan,dan struktur pohon Memerlukan kunci-kunci untuk menempatkan catatan-catatan
E. Arsitektur fisik,Perangkat keras,dan waktu tanggap
Dari sisi perangkat keras,waktu tanggap di pengaruhi oleh waktu akses fisik.ini adalah waktu yang dibutuhkan CPU untuk melakukan pemanggilan blok tunggal data dari disk,yang disebut waktu akses disk.faktor lain yang dapat mempengaruhi waktu tanggap adalah bagaimana catatan data secara fisik didistribusikan dalam disk.Dalam harddisk,data dalam trek atau silinder yang sama dapat di akses tanpa memindahkan alat baca tulis.harus di tekankan bahwa banyak sistem database yang tergantung pada kegiatan masukan atau keluaran sistem oprasinya.kebutuhan menyimpan file secara berurutanbergantung pada arsitektur fisik database dan metode akses file yang digunakannya.
Dari sisi perangkat keras,waktu tanggap di pengaruhi oleh waktu akses fisik.ini adalah waktu yang dibutuhkan CPU untuk melakukan pemanggilan blok tunggal data dari disk,yang disebut waktu akses disk.faktor lain yang dapat mempengaruhi waktu tanggap adalah bagaimana catatan data secara fisik didistribusikan dalam disk.Dalam harddisk,data dalam trek atau silinder yang sama dapat di akses tanpa memindahkan alat baca tulis.harus di tekankan bahwa banyak sistem database yang tergantung pada kegiatan masukan atau keluaran sistem oprasinya.kebutuhan menyimpan file secara berurutanbergantung pada arsitektur fisik database dan metode akses file yang digunakannya.