从国家基因组科学数据中心(NGDC)下载测序数据
Last updated on December 1, 2025 am
从国家基因组科学数据中心(NGDC)下载测序数据-Aspera命令行下载
首先用邮箱注册一个账号,最好是教育邮箱
要下载的数据: https://ngdc.cncb.ac.cn/gsa-human/browse/HRA002051 页面有数据下载还有样本信息
HTTPS网页端下载
点进去可以下载,但是每个样本的fastq文件太大了,还是换一种方式吧
使用FTP下载数据
方法参考官方手册:https://ngdc.cncb.ac.cn/gsa-human/document/GSA-Human_Request_Guide_for_Users_cn.pdf
这里使用XFTP,选择“新建”,弹出新建会话属性页面;名称随便,主机名称为human.big.ac.cn;协议改成FTP
取消勾选匿名登录,输入NGDC注册时的用户名和密码
显示用户身份验证失败,虽然手册中提到有的数据需要PI才能下载,但是我们这个数据是Open Access的,奇怪,换一种方式吧
使用Aspera命令行下载
IBM Aspera 是一项革命性的高速文件传输技术。它使用FASP®(Fast Adaptive and Secure Protocol)协议,非常适用于传输大型的文件。相较于FTP、HTTP等,其速度在传输超大文件或远距离传输时更快。
windows安装Aspera Connect
下载软件:https://downloads.asperasoft.com/connect2/
选择IMB Aspera Connect,然后选择默认目录下载
使用参考:https://blog.csdn.net/qq_40905198/article/details/101909201
记录在电脑里的安装位置:C:\Program Files\IBM\AsperaConnect\bin
找到之后重命名,去掉Aspera Connect的空格
NGDC下载页面的指引
点击“数据下载”栏的 Aspera命令行旁边的“帮助”,弹窗给出提示
弹窗提示
点击 Get the key file获得密钥文件
导入密钥文件
参考:https://www.jianshu.com/p/166f9eb8f741
先下载OpenSSH再导入密钥文件进Aspera;将该文件放入C:\Program Files\IBM\AsperaConnect\etc文件夹中(前面的路径不一定一样,但是找到AsperaConnect的安装路径下的/etc就好了)
运行ascp.exe
win+R 输入cmd ,先cd 定位到AsperaConnect的安装路径,然后运行ascp.exe
检查密钥,依旧改成我们自己放的/etc目录:这里是C:\Program Files\IBM\AsperaConnect\etc
输入type “C:\Program Files\IBM\AsperaConnect\etc\aspera01.openssh”
下载文件:
官方给的参考是
1 | |
[path/to/ascp]:替换为ascp可执行文件的完整路径;
[path/to/key/file]:替换为用于身份验证的私钥文件的路径;
[/your/local/path]:文件保存路径
因此我们这里的路径就替换成如下,可以先准备一个txt文件再慢慢粘贴,注意引号
1 | |
由于我们之前已经进入C:\Program Files\IBM\路径了,前面的部分可以省略
下载开始