Ich habe zwei Datensätze zur Herzfrequenz von Probanden, die an zwei verschiedenen Orten aufgezeichnet wurden (zwei verschiedene Kontinente, um genau zu sein). Die beiden Forschungsexperimente zielten darauf ab, die Emotionen der Probanden anhand der Veränderung ihrer Herzfrequenz im Laufe der Zeit zu ermitteln. Ich benutze maschinelles Lernen, um die Emotionen der Probanden vorherzusagen, und ich erhalte ein akzeptables Ergebnis, wenn ich es für jeden Datensatz separat teste. Ich erhalte jedoch ein noch besseres Ergebnis, wenn ich die beiden Datensätze zusammenführe.
Ich bin mir jedoch nicht sicher, ob die Kombination der beiden Datensätze akzeptabel ist. Wenn ich zwei irgendwie unterschiedliche Datensätze kombiniere, wird dies zu statistischen Verzerrungen führen? Wie soll ich meine Ergebnisse in einer Zeitschrift melden?