Die Frage ist schwer zu beantworten, da sie in einem Großteil der metaanalytischen Literatur auf eine allgemeine Verwirrung und einen durcheinandergebrachten Zustand hinweist (das OP ist hier nicht schuld - es ist die Literatur und die Beschreibung der Methoden , Modelle und Annahmen, die oft ein Chaos sind).
Um es kurz zu machen: Nein, wenn Sie eine Reihe von Schätzungen kombinieren möchten (die einen Effekt, einen Assoziationsgrad oder ein anderes als relevant erachtetes Ergebnis quantifizieren) und es sinnvoll ist, diese Zahlen zu kombinieren. dann könnte man einfach ihren (ungewichteten) Durchschnitt nehmen und das wäre vollkommen in Ordnung. Daran ist nichts auszusetzen, und unter den Modellen, die wir normalerweise bei der Durchführung einer Metaanalyse annehmen, erhalten Sie sogar eine unvoreingenommene Schätzung (vorausgesetzt, die Schätzungen selbst sind unvoreingenommen). Nein, Sie benötigen keine Stichprobenabweichungen, um die Schätzungen zu kombinieren.
Warum ist die inverse Varianzgewichtung fast gleichbedeutend mit einer tatsächlichen Metaanalyse? Dies hat mit der allgemeinen Idee zu tun, dass wir großen Studien (mit kleineren Stichprobenvarianzen) mehr Glaubwürdigkeit beimessen als kleineren Studien (mit größeren Stichprobenvarianzen). Tatsächlich führt die Verwendung der inversen Varianzgewichtung unter den Annahmen der üblichen Modelle zu dem einheitlich unverzerrten Schätzer für die minimale Varianz(UMVUE) - Nun, wenn wir wieder unvoreingenommene Schätzungen annehmen und die Tatsache ignorieren, dass die Stichprobenvarianzen tatsächlich oft nicht genau bekannt sind, sondern selbst geschätzt werden und in Zufallseffektmodellen, müssen wir auch die Varianzkomponente für die Heterogenität schätzen. aber dann haben wir es einfach als eine bekannte Konstante behandelt, was auch nicht ganz richtig ist ... aber ja, wir erhalten den UMVUE, wenn wir die inverse Varianzgewichtung verwenden, wenn wir nur unsere Augen sehr fest zusammenknicken und einige davon ignorieren Probleme.
Hier geht es also um die Effizienz des Schätzers, nicht um die Unparteilichkeit selbst. Aber selbst ein ungewichteter Durchschnitt ist oft nicht viel weniger effizient als die Verwendung eines gewichteten Durchschnitts mit inverser Varianz, insbesondere in Modellen mit zufälligen Effekten und wenn die Heterogenität groß ist (in diesem Fall führt das übliche Gewichtungsschema zu nahezu einheitlichen Gewichten wie auch immer!). Aber selbst in Modellen mit festen Effekten oder mit geringer Heterogenität ist der Unterschied oft nicht überwältigend.
Und wie Sie erwähnen, kann man auch leicht andere Gewichtungsschemata in Betracht ziehen, wie die Gewichtung nach Stichprobengröße oder eine Funktion davon, aber auch dies ist nur ein Versuch, etwas in die Nähe der inversen Varianzgewichte zu bringen (da die Stichprobenvarianzen sind, um weitgehend bestimmt durch die Stichprobengröße einer Studie).
Aber wirklich, man kann und sollte das Thema Gewichte und Varianzen insgesamt "entkoppeln". Es sind wirklich zwei getrennte Stücke, über die man nachdenken muss. Aber so werden die Dinge in der Literatur normalerweise nicht dargestellt.
Der Punkt hier ist jedoch, dass Sie wirklich über beides nachdenken müssen. Ja, Sie können einen ungewichteten Durchschnitt als kombinierte Schätzung verwenden, und dies wäre im Wesentlichen eine Metaanalyse. Wenn Sie jedoch mit der Schlussfolgerung auf der Grundlage dieser kombinierten Schätzung beginnen möchten (z. B. einen Hypothesentest durchführen, erstellen Sie ein Konfidenzintervall) ) müssen Sie die Stichprobenvarianzen (und das Ausmaß der Heterogenität) kennen. Stellen Sie sich das so vor: Wenn Sie eine Reihe kleiner (und / oder sehr heterogener) Studien kombinieren, ist Ihre Punktschätzung viel ungenauer als wenn Sie dieselbe Anzahl sehr großer (und / oder homogener) Studien kombinieren. Studien - unabhängig davon, wie Sie Ihre Schätzungen bei der Berechnung des kombinierten Werts gewichtet haben.
Tatsächlich gibt es sogar einige Möglichkeiten, die Stichprobenabweichungen (und das Ausmaß der Heterogenität) nicht zu kennen, wenn wir mit der Inferenzstatistik beginnen. Man kann Methoden in Betracht ziehen, die auf Resampling basieren (z. B. Bootstrapping, Permutationstests) oder Methoden, die konsistente Standardfehler für die kombinierte Schätzung liefern , selbst wenn wir Teile des Modells falsch spezifizieren - aber wie gut diese Ansätze funktionieren können, muss sorgfältig auf a bewertet werden von Fall zu Fall.