ネットキャッシングを知ろう!
- ■Infomation
-
カードキャッシング
カードキャッシングとは、クレジットカードやローン専用カードを利用して小口の融資を受けることをいいます。
外国為替の対象物を多数(たとえば千個以上)固定化しておき、これに対して一度に検査・実験を行うための材料または技術を指す総称である。
特に生物学・医学・薬学の方面で、20世紀末から核酸を対象とするDNAマイクロアレイを中心として開発が進み、利用されるようになってきた。
アレイ(Array)とは整列・並べたものの意味であり、数が少ない場合(数百個以下)にはマクロアレイ(Macroarray)と呼ぶこともある。
マイクロアレイの特長は多数の対象を一度に網羅的に扱える点にあり、これは特にバイオインフォマティクスやテイラーメイド医療(個人の体質に応じた医療)の要求を満たすものとして期待されている。具体的には次のようなものがある:
外為:DNAチップと呼ぶことも多い。DNAを固定化し、それらに相同性のあるDNA・RNAを検出・定量する方法。
タンパク質マイクロアレイ:タンパク質を多数固定化し、それに対する反応(低分子化合物や他のタンパク質の結合など)を検出する方法。代表的なものとして抗原を対象とした抗体マイクロアレイがある。なお「プロテイン(タンパク質)チップ」の名称("Protein chip"はLumicyte社の商標)は、特定のタンパク質の結合を検出・定量する方法(網羅的ではない、ビアコア社製品など)を指すものとしても用いられてきたが、これらについても網羅的な扱いを目指して改良されつつある。
細胞マイクロアレイ:多数の細胞を基板上に培養し、特定の反応を示すものを検出する方法。DNAでアレイを作製し、その上で細胞を培養してDNAの遺伝情報を発現させる方法もある。
組織マイクロアレイ:微小な組織標本を多数固定化し、これらについて免疫組織化学などの方法で特定の性質を示すものを検出する方法。
化合物マイクロアレイ:多種の低分子化合物を固定化し、それに対するタンパク質などの反応を検出する方法。コンビナトリアルケミストリーの発展と歩調を合わせて、医薬品などの開発ツールとして発展しつつある。
一部(特にDNAと化合物を対象とするもの)は、フォトリソグラフィを技術的基盤としている。しかしその他の方法については必ずしも先進技術を要素とするものではなく、組織マイクロアレイなどは古くからの技術に現代的な工夫を加えたものである。またタンパク質マイクロアレイでは固定化によって活性を失わないよう、タンパク質の種類に応じた技術が要求される。
応用数学、情報学、統計学、計算機科学などの技術応用によって生物学の問題を解こうとする学問である。生物情報学とも訳される。
FXは、配列アラインメント、遺伝子発見、ゲノムアセンブリ、タンパク質構造アラインメント、タンパク質構造予測、遺伝子発現とタンパク質間相互作用の予測、進化のモデリングなどである。
近年多くの生物を対象に実施されているゲノムプロジェクトによって大量の情報が得られる一方、それらの情報から生物学的な意味を抽出することが困難であることが広く認識されるようになり、バイオインフォマティクスの重要性が注目されている。
さらにマイクロアレイなどの網羅的な解析技術の発展に伴って、遺伝子発現のプロファイリング、クラスタリング、アノテーション(注釈)、大量のデータを視覚的に表現する手法などが重要になってきている。こういった個別の遺伝子、タンパク質の解析等から更に一歩進み、生命を遺伝子やタンパク質のネットワークとして捉え、その総体をシステムとして理解しようとするシステム生物学という分野もある。
たとえばヒトゲノム計画では、ある配列断片から順番に配列を解読する手法が考えられていたが、クレイグ・ベンターらによるショットガン法により遥かに高効率で解読が進められるようになった。ショットガン法はゲノム配列をバラバラな短い断片に分断してそれぞれを解読し、その後同一の配列を重複する領域として並べ替えることによってゲノム配列を再現するが、多くの断片がある中で正しい並び方を決定することはコンピュータの計算能力がなければ不可能である。
バイオインフォマティクスの手法として多用されるものの一つが相同性検索である。なかでもBLASTは相同性検索プログラムとして多用されている。このプログラムは配列 (シーケンス) の断片を問い合わせ情報として与えられると、その配列に最も類似した配列を NCBI (GenBank) などの配列データベース中から検索する。検索結果は、クローニングした遺伝子の部分情報から遺伝子全体の配列を予測したり、構造が未知のタンパク質の二次構造を予測したり、解読されたゲノムの中から遺伝子を検出してその機能を予測するなどの研究の基盤となる。
ゲノミクス研究の初期は遺伝子予測などがバイオインフォマティクスの主要な対象であった。しかし、最近はゲノムからの転写物の総体であるトランスクリプトーム、トランスクリプトーム(の一部)が翻訳されたタンパク質の総体であるプロテオーム、更に、ゲノムからの直接、転写・翻訳された実体ではなく、代謝ネットワーク (代謝マップ) によって生じた代謝産物をも含めた総体を考えるメタボローム、生物個体の表現形の総体であるフェノームなど、生物学全体を研究対象とする科学に拡大・発展しつつある。
解析(データマイニング、可視化、その他統計的手法による分析など)
このいずれの段階でもコンピュータは使用される。その形態はパーソナルコンピュータ (PC) を利用したスクリプトによる小規模なシーケンスデータ加工から、産業技術総合研究所生命情報工学研究センターなどによる IBM Blue Gene のような20TFlopsのスーパーコンピュータから大規模なコンピュータ・クラスターやグリッド・コンピューティングを用いたタンパク質の立体構造解析(タンパク質構造予測)まで様々である。
配列データベース(DDBJ, EMBL, GenBank[1], Swiss-Prot)
立体構造データベース(PDB[2])
パスウェイ・ネットワークデータベース(KEGG[3], BIND)
マイクロアレイデータベース (ArrayExpress)
文献データベース(MEDLINE/PubMed[4])
オントロジーデータベース(遺伝子オントロジー)
データはフラットファイル(一般的なテキストファイル)に比較的単純な形で保存されているケースも多いが、研究が本格化してデータ量が増大してくると、より効率的な利用を図るために関係データベース管理システム (RDBMS) やXMLなどを利用したより高度な管理が図られることが多い。生物学の研究においては、複数の公共データベースからのデータを使ったデータマイニングが非常に重要度を増しているため、データの相互利用と言う観点からも、XML、Webサービスなどの標準的技術の利用は今後も進んで行くと思われる。この考えを更に進め、セマンティック・ウェブ関連の技術(RDFやOWLなど)を利用した、コンピュータによるデータの相互利用を模索する動きもある。BioPaxプロジェクトなどはその一例である。
バイオインフォマティクスで扱うデータは、一次元の文字列(シーケンス全般)から、三次元構造のマトリクス (PDB) 、計算機科学におけるグラフ(ネットワークデータ全般)、遺伝子オントロジーのような非循環有向グラフ (DAG; directed acyclic graph) と言った非常に多岐にわたるデータ構造を持つ。従って、それらを有機的に結びつけ、有効に活用するためには、最新の情報関連技術が不可欠である。
日本語を母語とする人々にとっては、日本語でいろいろなデータベースのサービスを提供している以下のようなサイトが便利である。