Perkembanghan di bidang
bioinformatika harus diimbangi dengan kemajuan teknologi penyimpan dan pengolah
data. Karena produk dari bioinformatika adalah data. Salah satu tantangan yang paling sulit yang dihadapi
dalam bidang bioinformatika adalah bagaimana untuk menyimpan
dengan cara yang mudah
diakses,
dari data yang berupa
urutan genom keseluruhan, penemuan gen baru yang sedang berlangsung dan produk
gen, penentuan fungsi dan struktur berbagai macam protein
dan berbagai macam data yang berhubungan dengan biologi khususnya molekuler.
A. NCBI (National Center for Biotechnology
Information)
Gb.
01 Home NCBI
NCBI didirikan sebagai respon pemerintah terhadap kebutuhan untuk
informasi lebih lanjut dan lebih baik metode pengolahan untuk menangani
tantangan ini. National Centerfor Biotechnology Information (NCBI) menyediakan
situs web yang komprehensif yang
mencakup biologi yang berhubungan dengan database, dan alat untuk melihat dan
menganalisis data yang ada di database.
National Center for Biotechnology Information (NCBI) adalah bagian dari
Amerika Serikat National Library of Medicine (NLM), sebuah cabang dari National
Institutes of Health. NCBI terletak di Bethesda, Maryland dan didirikan pada
tahun 1988 melalui legislasi yang disponsori oleh Senator Claude Pepper
sebagai database biologi molekuler. Alamat situs situs http://www.ncbi.nlm.nih.gov/.
NCBI membuat database yang dapat diakses secara umum, mengembangkan alat
bantu software untuk menganalisis data genom dan menyebarkan
informasi biomedik yang digunakan untuk proses molekuler. Beberapa database yang
tersedia di NCBI meliputi:
·
Database bank gen skuens DNA yang mengandung lebih dari
9.103.000 skuens nukleotida,
·
Database model molekuler (Molecular Modeling Database
= MMDB) yang terdiri dari struktur tiga dimensi protein sebagai alat
bantu visualisasi dan analisis perbandingan,
Data dapat Diakses pada NCBI:
1. BLAST
BLAST (Basic Local Alignment Search Tool) merupakan suatu alat
pencari yang dapat menyesuaikan dan mencari sekuen yang mirip dengan sekuen
meragukan yang kita miliki melalui perbandingan sekuen melalui GenBank DNA
database dalam waktu singkat.
Ada 5 program utama dalam BLAST, yaitu :
Ada 5 program utama dalam BLAST, yaitu :
a)
Nucleotide blast (blastn) : membandingkan suatu sekuen
nukleotida yang kita miliki dengan database sekuen nukleotida
b)
Protein blast (blastp) : membandingkan suatu sekuen
asam amino yang kita miliki dengan database sekuen protein
c)
Blastx : membandingkan produk translasi konsep 6-frame
sebuah sekuen nukleotida (translated nucleotide) yang kita miliki dengan
database sekuen protein
d)
Tblastn : membandingkan suatu sekuen protein yang kita
miliki dengan database sekuen nukleotida yang secara dinamis ditranslasi pada
semua pembacaan 6 frame.
e)
Tblastx : membandingkan suatu translasi 6 frame dari
nukleotida.
2.
JURNAL
Beberapa journal penelitian dapat diakses pada database NCBI melalui
Pubmed maupun Pubmed central. PubMed adalah sebuah layanan dari National Library of
Medicine, yang menyertakan lebih dari 20 juta kutipan untuk artikel-artikel
biomedis sejak tahun 1950-an hingga kini. Kutipan-kutipan itu dari MEDLINE dan
tambahan dari jurnal-jurnal sains kehidupan.
PuMed menyertakan link ke banyak situs yang
menyediakan teks lengkap dari artikel tersebut dan sumber-sumber yang
berhubungan. PubMed Central (PMC) adalah tempat arsip digital jurnal
bebas/gratis yang disediakan oleh Institut Kesehatan Nasional AS (National
Institutes of Health-NIH) yang menyediakan literatur ilmiah di bidang biomedik
dan ilmu
hayat.
3. DATABASE NUKLEOTIDA DAN PROTEIN
Database Nukleotida merupakan
kumpulan urutan dari beberapa sumber data, termasuk GenBank, RefSeq, TPA dan PDB.
Genom, gen dan transkrip data sekuens memberikan dasar untuk penelitian biomedis
dan penemuan.
Database Protein merupakan
kumpulan urutan dari beberapa sumber data, termasuk terjemahan dari daerah coding
dijelaskan di GenBank, RefSeq dan TPA, serta catatan dari SWISSPROT, PIR, PRF, dan
PDB. Urutan protein merupakan penentu fundamental dari struktur biologis dan
fungsi.
4.
GenBank
GenBank adalah urutan NIH database genetik, koleksi
beranotasi semua urutan DNA tersedia untuk umum. Ada sekitar 126.551.501.141
pangkalan di 135.440.924 catatan urutan di divisi GenBank tradisional dan
191.401.393.188 pangkalan di 62.715.288 catatan urutan di divisi WGS. Catatan
rilis lengkap untuk versi GenBank tersedia di situs ftp NCBI. Sebuah rilis baru
dibuat setiap dua bulan. GenBank merupakan bagian dari Kolaborasi Urutan
Nukleotida Internasional database, yang terdiri databank DNA Jepang (DDBJ),
Molecular Biology Laboratory Eropa (EMBL), dan GenBank di NCBI. Ketiga
organisasi pertukaran data setiap hari. Contoh dari catatan GenBank dapat
dilihat untuk gen Saccharomyces cerevisiae.
Akses ke GenBank
Cari GenBank untuk
pengidentifikasi urutan dan penjelasan dengan Entrez Nukleotida, yang terbagi
menjadi tiga divisi: CoreNucleotide (koleksi utama), dbEST (Tag urutan
Dinyatakan), dan dbGSS (Genome Urutan Survey). Cari dan menyelaraskan
urutan GenBank ke urutan query menggunakan BLAST (Basic Penyelarasan Alat
Pencarian Lokal). Pencarian BLAST CoreNucleotide, dbEST, dan dbGSS mandiri;
melihat info BLAST untuk informasi lebih lanjut tentang database BLAST banyak.
Cari link dan urutan. Upload programatik menggunakan NCBI e-utilitas.
GenBank Data Usage
Database GenBank
dirancang untuk menyediakan dan mendorong akses dalam komunitas ilmiah untuk
sebagian to date dan informasi urutan DNA yang komprehensif. Oleh karena itu,
NCBI menempatkan tidak ada pembatasan pada penggunaan atau distribusi dari data
GenBank. Namun, beberapa mungkin menyerahkan mengklaim paten, hak cipta, atau
hak kekayaan intelektual dalam semua atau sebagian dari data yang mereka telah disampaikan.
NCBI tidak dalam posisi untuk menilai keabsahan klaim tersebut, dan karena itu
tidak dapat memberikan komentar atau izin terbatas mengenai penggunaan,
menyalin, atau distribusi dari informasi yang terdapat dalam GenBank.
Dalam NCBI juga
terdapat data mengenai bentuk-bentuk tiga dimensi protein. Menu yang terdapat
pada home NCBI adalah:
·
Chemicals & Uji hayati
·
Data & Software
·
DNA & RNA
·
Domain & Struktur
·
Gen & Ekspresi
·
Genetika & Pengobatan
·
Genom & Maps
·
homologi
·
literatur
·
protein
·
urutan Analisis
·
taksonomi
·
Pelatihan & Tutorial
·
variasi
B.
EBI
The European Bioinformatics Institute (EBI) adalah
sebuah organisasi non-profit akademik yang merupakan bagian dari Laboratorium
Biologi Molekuler Eropa ( EMBL ). EBI adalah sebuah pusat penelitian dan jasa
di bioinformatika. Lembaga mengelola database dari data biologi termasuk asam
nukleat, urutan protein dan struktur makromolekul.
Ketika kita bergerak menuju pemahaman biologi pada
tingkat sistem, akses ke data yang besar dan beragam menjadi
kebutuhan yang sangat penting.
Teknologi seperti genom-sequencing, mikroarray, proteomik dan genomik
struktural telah memberikan 'daftar bagian' bagi organisme hidup, dan peneliti
kini berfokus pada bagaimana membentuk suatu sistem bersama. Namun, revolusi tinggi-throughput juga mengancam
menenggelamkan kita dalam data. Data hasil penelitian
dari berbagai macam sumber yang jumlahnya sangat besar memerlukan tempat
penyimpanan yang mudah diakses dan membutuhkan sistem untuk mengolah data
dengan lebih cepat dan efisien. EBI merupakan salah satu situs yang dapat
digunakan untuk akses dan mengolah data.
Gb.
02. Home EBI
MENU-MENU YANG ADA DI DALAM SITUS EBI
1. Database Index, terdiri dari sub
menu:
a)
Database Browsing
EBI
menyediakan akses ke banyak alat bantu untuk browsing dan mengambil data
terkait biologis dan data literatur.
b)
Biological Ontologies
EBI
telah mengembangkan dan mempertahankan sejumlah database ontologi biologi dan
jasa terkait.
c)
Literatur
EBI
telah mengembangkan dan mempertahankan sejumlah database ontologi biologi dan
jasa terkait.
d)
Funcional Genomic
Terdiri
dari sub menu Array Express dan Gen Ekspression Atlas. Arsip ArrayExpress
adalah database percobaan genomik fungsional termasuk ekspresi gen di mana
pengguna dapat men-download dan meng-query data yang dikumpulkan dengan standar
MIAME dan MINSEQE. Gene Expression Atlas berisi subset data Arsip curated dan
re-catatan yang dapat dilihat untuk ekspresi gen individu di bawah kondisi
biologis yang berbeda di seluruh percobaan.
e) Nukleotid
Merupakan
kumpulan link ke berbagai macan databese nukleotid seperti DGVa, EGA, ENA,
Ensembl, Ensembl Genomes, Genome Reviews, ENA Genomes Server, HGNC, IMGT/HLA,
IMGT/LIGM, IPD dan Parasites.
f) Pathways
and Networks
EBI
membangun jalur dan database jaringan seperti BioModels, IntAct, Reactome, dan
Rhea.
g)
Database mengenai protein dan proteomics
h)
Small Molecules
EBI
telah mengembangkan dan memelihara database berikut struktur kimia dari molekul
organik kecil dan informasi tentang kegiatan mereka yang berhubungan dengan
biologi
i)
Structure yang berisi data mengenai
berbagai macam struktur protein
2. Tools
a.
ID Mapping, menyediakan layanan ID
mapping yaitu PLRC.
b.
Literatur, menyediakan link literatur
seperti: EBIMed, Protein Corral, Whatizit
c.
MicroArray Analysis berupa Biokonduktor,
Akspresion Profiler
d.
Protein Fungsional Analysis
e.
Proteomic Services
f.
Sequense analysis, analisis urutan dan
menentukan fungsi biologi dan atau struktur gen dan protein yang telah dikode.
Alat seperti Transeq dapat membantu menentukan protein coding daerah dari
urutan DNA. ClustalW2 ini digunakan untuk menyelaraskan urutan DNA atau protein
dalam rangka untuk menjelaskan keterkaitan serta asal usul evolusi.
g.
Similarity dan Homology, urutan
pencarian Kesamaan adalah metode pencarian database urutan dengan menggunakan
keselarasan dengan urutan permintaan. Dengan statistik menilai seberapa baik
database dan permintaan sesuai dengan salah satu urutan dapat menyimpulkan
informasi homology dan transfer ke urutan permintaan. Alat ini dapat
diluncurkan dengan bentuk yang berbeda pra-set menggunakan tombol ini dapat diubah pada halaman alat juga.
h.
Structural Analysis.
i.
Tool-Miscellaneous