Ich habe Datei1 wie folgt:
CHR SNP TEST A1 A2 GENO O(HET) E(HET) P
0 AFFX-SNP-000541 ALL 0 0 0/0/0 nan nan 1
0 AFFX-SNP-000541 AFF 0 0 0/0/0 nan nan NA
0 AFFX-SNP-000541 UNAFF 0 0 0/0/0 nan nan NA
0 AFFX-SNP-002255 ALL 0 0 0/0/0 nan nan 1
0 AFFX-SNP-002255 AFF 0 0 0/0/0 nan nan NA
0 AFFX-SNP-002255 UNAFF 0 0 0/0/0 nan nan NA
1 rs12103 ALL C T 55/250/317 0.4019 0.4113 0.5596
1 rs12103 AFF C T 0/0/0 nan nan NA
1 rs12103 UNAFF C T 0/0/0 nan nan NA
1 rs12103_1247494 ALL C T 55/250/321 0.3994 0.4097 0.5581
1 rs12103_1247494 AFF C T 0/0/0 nan nan NA
1 rs12103_1247494 UNAFF C T 0/0/0 nan nan NA
Und file2 wie:
CHR SNP A1 A2 MAF NCHROBS
0 AFFX-SNP-000541 0 0 NA 0
0 AFFX-SNP-002255 0 0 NA 0
1 rs12103 C T 0.2894 1244
1 rs12103_1247494 C T 0.2875 1252
Ich möchte Datei2 mit Datei1 basierend auf dem SNP-Namen und dem TEST == ALL zusammenführen und CHR, SNP, P und MAF in der Ausgabedatei3 behalten. Kennt jemand den besten Weg dafür in der Terminal (Unix) Shell?
Eine gewünschte Ausgabe wäre:
CHR SNP MAF P
0 AFFX-SNP-000541 NA 1
0 AFFX-SNP-002255 NA 1
1 rs12103 0.2894 0.5596
1 rs12103_1247494 0.2875 0.5581