米議会図書館は、1,700億件の Twitter への投稿を収集したと公表した。だが、同図書館はビッグデータ取り扱い上の技術的問題を解決できておらず、このため外部の研究者に対して検索可能データの提供が開始できずにいる。

CNN はこの件を次のように伝えた。

「米議会図書館が収集している Twitter への投稿は、これまでに1,700億件を超えた。同図書館は現在、このデータを研究者などが利用できるようにするため、その方法を模索している」

米議会図書館は Twitter の投稿の収集について、公式 Blog で次のように述べている。

「米議会図書館の最初の目標は、2006年から2010年の間の Twitter への投稿を収蔵することだった。具体的には、安全でかつ継続可能な Twitter ストリームの受信と保存の手法を確立させ、データ全体を日付順に整理すること。この目標は、2013年1月中に完了予定となっている。我々はすでにおよそ1,700億件の投稿を受け取っており、その数は現在も増加中だ。図書館が受け取る Twitter への投稿件数は、2011年2月の時点では1日に1億4,000万件だったが、2012年の10月の時点では5億件近くに達している」

PCMag は、米議会図書館はすでに投稿を閲覧したいという多くのリクエストを受け取っていることを伝えている。

「最初の目標が達成された現在、米議会図書館はさらに大きな目標に取り組んでいる。それは膨大な量の Twitter への投稿を、研究者らに対してどのように公開するか、というものだ。公開の方法は、わかりやすく、かつ有益なものでなければならない。図書館が収蔵する投稿を閲覧したいという研究者からの問い合わせは、すでに400件を超えており、その研究のテーマは、市民ジャーナリズムの分析から、株式市場予測まで様々だ」

Digital Trends  は、Twitter への投稿が膨大であるため、現時点では検索に時間がかかってしまうことを伝えている。

「米議会図書館は、Twitter への投稿にアクセスを求めるリクエストをすでに400件以上受け取っているとしているが、現時点ではアクセスを許可されたものはない。その理由は、すでに整理済みとされる2006年から2010年までの投稿を検索するのにさえ、最大でまる1日かかってしまうためだ。この状況を同図書館は、『研究者にアクセスを許可するには、まだ準備ができていない段階』だと述べている」