Забекапить и восстановить вектор из файла

Kadet89

Имею вектор чаровы по 8 бит каждый элемент std::vector muz; вцелом весь вектор занимает около 200 мегабайт. Нужно в приложение добавить возможность сохранять и восстанавливать на ходу на raid ssd, притом за максимальную скорость, желательно за миллисекунды. Я представляю это так, узнаю в какой области памяти лежит вектор ... или конкретнее где он начинается и сколько занимает и дальше какой-то специальной функцией копирую его как простую бинарную строку в файл. Помогите пожалуйста реализовать.Вот нашел такой пример для записи:
int main(void)
{
    FILE *fp;
    size_t count;
    char const *str = "привет\n";
 
    fp = fopen("пример.txt", "wb");
    if(fp == NULL) {
        perror("ошибка открытия пример.txt");
        return EXIT_FAILURE;
    }
    count = fwrite(str, 1, strlen(str), fp);
    printf("Записано %lu байт. fclose(fp) %s.\n", (unsigned long)count, fclose(fp) == 0 ? "успешно" : "с ошибкой");
 
    return 0;
}
Где fwrite (*p, size, n, *f); Функция записывает n элементов длиной size байт из буфера,заданного указателем p,в поток f. Возвращает число записанных элементов. Мне получается нужно задать указатель на начало вектора, определить его длину и тогда можно прямиком копировать его в файл, правильно?
14 ответов

Kadet89

Да, начало данных в std::vector получаете с помощью &a[0](если есть например объявление std::vector a; ), зная действительную длину можно копировать напрямую, так как данные гарантированно будут располагаться линейно.


Kadet89

Вот я ещё одну функцию нашел, тот, кто её написал, сказал что работает очень быстро...
void writeCubeToFile(const std::vector<char> &day_us)
{
    const unsigned int blocksize = 262144; // Наиболее эффективно записывать блоками по 256 килобайт
    unsigned long blocks = distance(day_us.begin(), day_us.end()) / blocksize;
 
    std::ofstream outfile("nanocube.txt", std::ios::out | std::ios::binary);
 
    for(unsigned long i = 0; i <= blocks; i++)
    {
        unsigned long position = blocksize * i;
 
        if(blocksize > distance(day_us.begin() + position, day_us.end()))
             outfile.write(&*(day_us.begin() + position), distance(day_us.begin() + position, day_us.end()));
        else outfile.write(&*(day_us.begin() + position), blocksize);
    }
 
    outfile.write("\0", 1);
 
    outfile.close();
}
но у меня она не работает, помогите пожалуйста поправитьMa3a немогли бы вы набросать? В инете вообще нет ниодного примера такой реализации, везде все решают проблему перебором массива итератором...


Kadet89

Kadet89, при необходимости быстрого ввода/вывода файлового я предпочитаю использовать istreambuf_iterator/ostreambuf_iterator, так как они позволяют производить операции с файлами напрямую, в обход ненужного в данном случае форматирования и прочих накладных расходов. Пример сейчас приведу.выйдет примерно так:
void myOutput(const std::vector<char> &day_us)
    {
    std::ofstream outfile("test.txt", std::ios::out | std::ios::binary);
    std::ostreambuf_iterator<char> it(outfile);
    std::copy(day_us.begin(),day_us.end(),it);
    outfile.close();
    }
Насчет того, что быстрее: блоковый вывод или такой подход, скажу, что при использовании ostreambuf_iterator время незначительно отличается( чего не скажешь о ostream_iterator, которые работают значительно медленнее), так что стоит хорошо рассчитать все риски, прежде чем думать над блоковым выводом, так как в таком случае еще придется подбирать оптимальный размер блока для наибольшей скорости, а здесь такого нет.Kadet89, а ваша версия не работает потому, что в функцию передается std::vector<********>, хотя должен бы std::vector, так как outfile.write ожидает указателей на char, а у вас вышел бы не char *, а ******** *, что компилятору и не нравится.


Kadet89

Очень удивила версия с поблочной записью. Неужели программист считал что таким образом обгонит стандартную библиотеку?


Kadet89

Насчет разных типов данных
void myOutput(const std::vector<int> &day_us)
        {
        std::ofstream outfile("test.txt", std::ios::out | std::ios::binary);
        std::ostreambuf_iterator<int> it(outfile);
        std::copy(day_us.begin(),day_us.end(),it);
        outfile.close();
        }
если использовать int, то уже почему-то не работает получается данный метод применим только для char? А как тогда быть если мне понадобится сохранять значения с более чем 256 уровнями? ... всмысле более 8 бит
Очень удивила версия с поблочной записью. Неужели программист считал что таким образом обгонит стандартную библиотеку?
ммм, не знаю, почитайте сами: _http://stackoverflow.com/questions/1693089/fastest-way-to-write-large-stl-vector-to-file-using-stl


Kadet89

deleted. Не всек чуток.


Kadet89

Kadet89, если бы мы использовали ostream_iterator, то это бы прокатило, но ostreambuf_iterator - более низкоуровневый интерфейс и работает или с обычными потоками и char типом, либо с широкими потоками и wchar_t соответственно.


Kadet89

А как тогда быть? ostream_iterator использовать или тут уже блочная запись возможно выиграет? Или переводить int в char[4]?


Kadet89

Дак с блочной записью все равно придется иметь дело с ofstream.write, которая как я уже говорил , работает с char const *. Как вариант(да и наверное как оптимальный при учете количества выводимых данных) будет лучше всего воспользоваться чем-то вроде
std::ofstream outfile("test.txt", std::ios::out | std::ios::binary);
outfile.write((const char *)&day_us[0],sizeof(int) * day_us.size());
если использовать ostreambuf_iterator, то можно и так
void myOutput(const std::vector<int> &day_us)
    {
    std::ofstream outfile("test.txt", std::ios::out | std::ios::binary);
    std::ostreambuf_iterator<char> it(outfile);
    std::copy((char *)(&day_us[0]),(char *)(&day_us[0] + day_us.size()),it);
    outfile.close();
    }


Kadet89

Ну и последний вопрос, после записи тогда уж вектора int'ов в файл
void myOutput(const std::vector<int> &day_us)
        {
        std::ofstream outfile("test.txt", std::ios::out | std::ios::binary);
        std::ostreambuf_iterator<char> it(outfile);
        std::copy((char *)(&day_us[0]),(char *)(&day_us[0] + day_us.size()),it);
        outfile.close();
        }
как этот вектор из файла восстановить?


Kadet89

Можно так
void *******(std::vector<int> &my)
    {
    std::ifstream infile("test.txt",std::ios::in | std::ios::binary);
    std::istreambuf_iterator<char> it(infile);
    std::copy(it,std::istreambuf_iterator<char>(),(char *)&my[0]);
    infile.close();
    }
только данный код рассчитан на то, что память под хранилище вектора выделена и имеет такой же размер, что и количество байтов, считанное из файла, иначе будут проблемы.


Kadet89

...только данный код рассчитан на то, что память под хранилище вектора выделена и имеет такой же размер, что и количество байтов, считанное из файла, иначе будут проблемы.
Ну это не проблема Большое спасибоВот собрал всё в кучу, но не заработало. Файл даже не создается. Создал вручную, выставил права на запись, но всёравно приложение в него ничего не заносит...
#include <stdio.h>
#include <stdlib.h>
#include <vector>
#include <iostream>
#include <fstream>
 
void myOutput(const std::vector<int> &day_us)
        {
        std::ofstream outfile("test.txt", std::ios::out | std::ios::binary);
        std::ostreambuf_iterator<char> it(outfile);
        std::copy((char *)(&day_us[0]),(char *)(&day_us[0] + day_us.size()),it);
        outfile.close();
        }
 
void *******(std::vector<int> &my)
        {
        std::ifstream infile("test.txt",std::ios::in | std::ios::binary);
        std::istreambuf_iterator<char> it(infile);
        std::copy(it,std::istreambuf_iterator<char>(),(char *)&my[0]);
        infile.close();
        }
 
int main()
{
 
    std::vector<int> day_us;
    std::vector<int> vost;
 
    day_us.resize(10);
    vost.resize(5);
    day_us.reserve(250);
    vost.reserve(250);
 
    day_us.push_back(11);
    day_us.push_back(13);
    day_us.push_back(666);
    day_us.push_back(898);
    day_us.push_back(1028);
 
    myOutput(day_us); // Сохраняем массив в файл
    *******(vost); // Загружаем массив из файла
 
    for (int i = 0; i < day_us.size(); i++)
        std::cout << "Исход: " << day_us[i] << "\n"; // Выводим массив на запись
 
    for (int a = 0; a < vost.size(); a++)
        std::cout << "Восст: " << vost[a] << "\n"; // Выводим восстановленный массив
 
}
Если занять файл другим приложением, то выводится "Отказано в доступе". Т.е. приложение всётаки его открывает... Пробовал занести в него значения вручную, но вектор из них не восстановился Консоль:
Исход: 0 Исход: 0 Исход: 0 Исход: 0 Исход: 0 Исход: 0 Исход: 0 Исход: 0 Исход: 0 Исход: 0 Исход: 11 Исход: 13 Исход: 666 Исход: 898 Исход: 1028 Восст: 0 Восст: 0 Восст: 0 Восст: 0 Восст: 0 конец
Полагаю ошибки в строках 40 и 41?


Kadet89

Kadet89, собственно о чем я и говорил в последнем посте ******* работает верно только в том случае , когда действительный размер хранилища вектора в байтах равен тому, сколько байтов будет считано из файла( или хотя бы не меньше ). Насчет того, что файл не создается - у меня вот создается и всё хорошо, здесь хз. По поводу того, что не восстанавливается вектор, проследим работу вашей программы и всё станет сразу ясно:1) Сначала day_us и vost содержат 10 и 5 нулевых элементов соответственно( resize'ы ), то есть фактический размер их -- 10 и 5. 2) Вы забиваете в day_us еще 5 элементов, то есть day_us.size() == 15 3) Вы вызываете reserve для обоих векторов - это выделяет память под хранилище обоих векторов на 250 элементов, но действительные размеры векторов остались по-прежнему 15 и 5. 4) С myOutput должно быть всё ясно 5) После ******* в vost нормально копируются 15 элементов( потому что вы зарезервировали место под 250 элементов), которые были в day_us, но их вы не увидите, так как реальный размер контейнера остался неизменным и равен по-прежнему 5!Ошибки при ******* не будет , так как хоть и размер вектора равен 5, но память дальше еще есть выделенная. Тем не менее, при выводе вектора vost выведутся только первые 5 элементов , так как vost.size() == 5, о чем я и скачал в самом начале: действительный размер ( vost.size() должен быть равен размеру day_us.size() на момент вызова ******* ). В любом случае для решения данной проблемы можно просто откорректировать размеры vost, чтобы он был такой же большой , как и day_us, соответствующим вызовом resize, только на нужный размер.Короче, когда крутите такие штуки со стандартными контейнерами, никогда не забывайте, что потенциально можете нарушить целостность контейнера, то есть его внутреннее состояние, что может фатально сказаться на работе контейнера и программы вцелом, например как здесь : вектор vost не знает свой действительный размер(элементов-то вроде и 15, но vost.size() равен 5 ).


Kadet89

Да, всё понятно, оказалось файл создаётся не там, где я этого ожидал. Один момент,
В любом случае для решения данной проблемы можно просто откорректировать размеры vost, чтобы он был такой же большой , как и day_us, соответствующим вызовом resize, только на нужный размер.
vost.resize(20); У меня они таким образом зануляются, хотя по документации вроде не должны Но значения там присутствуют, я это проверил вот так
for (int i = 0; i < day_us.size()+10; i++)
Может я ошибаюсь, сейчас попробую изучить этот вопрос подробнее, но если это так, то решения 2, - либо задавать размер вектора иным способом, при котором элементы не затрагиваются, если такой есть, - либо сначала делать resize на нужное количество элементов, а потом из файла не добавлять к ним новые, а как-то записывать поверх начиная с первого.