Erste Frage: Warum befinden Sie sich zunächst in einer relationalen Datenbank, wenn Sie keine ACID-Eigenschaften benötigen? Es hört sich so an, als würden Sie nicht transaktionale Arbeiten ausführen. Daher ist es für Ihre Umgebung wahrscheinlich zu schwer, ein RDMBS mit Transaktionen zu erhalten.
Zweite Frage: Welche Art von Daten speichern Sie? Sie scheinen eine Column-Store-Datenbank zu benötigen, und das ist für eine Art Data-Warehouse-Projekt.
Dritte Frage: Wenn Sie mit PostgreSQL (einer guten Datenbank wie sie ist) nicht weiterkommen, ist es die aktuelle Version? Ältere Versionen vor 8.x sind notorisch langsam, aber seitdem wurde viel Arbeit in Verbesserungen gesteckt, und einige der von Ihnen erwähnten Probleme - wie das Autovakuum - können jetzt problemlos mit den Einstellungen zum Festlegen und Vergessen behoben werden.
* Data growing with snowball effect
Einige zusätzliche Infos dazu wären nett. Warum ist es Schneeball? Können Sie es normalisieren, um den Speicherplatz zu reduzieren?
* existing postgresql locks table etc for vaccuum tasks periodically
Wenn dies ein Problem ist, kann ich bereits feststellen, dass Sie eine ältere Version verwenden. Neuere Versionen verfügen hierfür über Steuerelemente pro Tabelle, und Sie können sie sogar vollständig deaktivieren.
* Archiving data is tideous currently
Es ist schwierig, hier ein Urteil zu fällen, da es nicht viel gibt, mit dem man arbeiten kann. Auf welche Medien wird das Archiv verschoben? Wie viel nachhaltige E / A ist beteiligt? In welchem Zeitrahmen arbeiten Sie? Wie viele Daten? Muss es ein "heißer" Dump sein oder kann es "kalt" sein?
* Human interaction involved in existing archive, vaccuum, ... process periodically
Ich versuche zu sehen, wie "normale" Verwendung manuelle Eingriffe erfordern würde, weil dies nicht der Fall sein sollte. Das Vakuum erfolgt jetzt automatisch und kann (wie bereits erwähnt) so eingestellt werden, dass es überhaupt nicht erfolgt. Die meisten Sicherungen werden per Skript erstellt (und wenn Sie Skripte erstellen können, können Sie einen Zeitplan erstellen). Wie kommt es also dazu?
* Need a 'set it. forget it. just add another server when data grows more.' type of solution
Sie sprechen von einer Cluster-Server-Anordnung.
Es klingt für mich wie folgt:
- Sie befinden sich in einem RDBMS und die Transaktionsnatur ist nicht für Ihre Anwendung geeignet.
- Ihre Anwendung scheint einen meist gelesenen Datenbankstil zu wollen. Es hört sich auch nicht so an, als ob Sie es brauchen, um Transaktionsintegrität zu haben.
- Das Datenvolumen, das Sie verarbeiten, ist höchstwahrscheinlich weder normalisiert, noch wurde versucht, es zu normalisieren.
- Sie machen waaaaaay zu viel von Hand und benötigen mehr Automatisierung.
- Sie mögen die Idee einer Clusterlösung, möglicherweise "Cloud Style" Computing.
Abgesehen davon gibt es hier nicht genügend Informationen, um herauszufinden, was eine gute Passform wäre.