Intro
Wir hatten Histogramme und haben gezählt , aber nicht alle aufgelistet.
Jedes Jahr veranstaltet Dyalog Ltd. einen Studentenwettbewerb. Die Herausforderung besteht darin, guten APL-Code zu schreiben . Dies ist eine sprachunabhängige Code-Golf- Ausgabe des diesjährigen sechsten Problems.
Ich habe die ausdrückliche Erlaubnis, diese Herausforderung hier vom ursprünglichen Autor des Wettbewerbs zu posten. Sie können dies jederzeit überprüfen, indem Sie dem angegebenen Link folgen und den Autor kontaktieren.
Problem
Der Begriff k-mer bezieht sich typischerweise auf alle möglichen Teilzeichenfolgen der Länge k , die in einer Zeichenfolge enthalten sind. In der Computational Genomics beziehen sich k-mere auf alle möglichen Teilsequenzen (mit der Länge k ) aus einem durch DNA-Sequenzierung erhaltenen Messwert. Schreiben Sie eine Funktion / ein Programm, das eine Zeichenfolge und k (die Länge der Teilzeichenfolge) verwendet und einen Vektor der k-mere der ursprünglichen Zeichenfolge zurückgibt / ausgibt.
Beispiele
[4,"ATCGAAGGTCGT"]
→ ["ATCG","TCGA","CGAA","GAAG","AAGG","AGGT","GGTC","GTCG","TCGT"]
k > Stringlänge? Nichts / kein leeres Ergebnis zurückgeben:
[4,"AC"]
→ []
oder ""
oder[""]
['A', 'T', 'C', 'G']
"ATCG"