Zadanie z laboratorium programowania C++ na Informatyce UW.
Program zaliczeniowy ? wersja finalna ? 2008-10-23. Program zaliczeniowy polega na napisaniu aplikacji w C++. Celem aplikacji jest wykonywanie prostych programów na danych. Programem nazywamy listę kolejnych operacji na danych. Każdy program jest postaci: operacja operacja .... operacja Każda operacja jest pewnym przekształceniem plików z danymi. Są dostępne następujące operacje: ? Operacja filtrowania ? Składania: FILTER . ? =, !=, >, =, <=. ? Schemat pliku wynikowego jest taki sam jak źródłowego. ? Operacja dołączenia ? Składnia: MERGE ? Operacja polega na zsumowaniu kolumn plików 1 i 2. ? Operacja powiedzie się jeśli kolumny plików 1 i 2 mają inne nazwy oraz ilość wierszy w pliku 1 i w pliku 2 jest taka sama. ? Wynikowy plik ma wszystkie kolumny pliku 1 i wszystkie kolumny pliku 2. ? Operacja łączenia ? Składnia: JOIN ? Operacja polega na wypisaniu do pliku docelowego najpierw zawartości pliku1 a za nim pliku2. ? Operacja jest wykonalna tylko i wyłącznie, gdy ilość kolumn pliku1 i pliku2 jest taka sama i typy kolejnych kolumn są takie same. ? Wynikowy plik ma schemat taki sam jak plik1. ? Operacja wyliczenia ? Składnia: AGREGATE ? oznacza operację z listy: maksimum [MAX], minimum [MIN], suma [SUM], średnia [AVG] (zaokrąglenie do int'a), ilość [COUNT]. ? Operacja powiedzie się jeśli typ danych jest zgodny z operacją. ? Wynikowy plik ma strukturę złożoną z jednej kolumny o podanej nazwie typu int oraz zawiera jeden wiersz z wynikiem operacji. ? Operacja dodania danych. ? Składnia: INSERT ... ? Operacja dodaje wiersz danych na końcu pliku danych. ? Operacja się powiedzie jeśli ilość danych zgadza się z listą kolumn oraz typu danych się zgadzają. ? Operacja ładowania danych. ? Składnia: LOAD ? Operacja odczytuje linia po linii dane z pliku wejściowego i dopisuje je na końcu wskazanego pliku. ? Dane w pliku z danymi są zapisane linia po linii. ? Każda linia zawiera jeden rekord danych.? Każda linia zawiera pewną ilość pól postaci ... ? Każda wartość jest zapisana w formacie wartości przyjmowanym we wszystkich komendach. ? Operacja się powiedzie jeśli ilość danych zgadza się z listą kolumn oraz typu danych się zgadzają. ? Operacja stworzenia pustego pliku. ? Składnia: CREATE ... ? Operacja tworzy pusty plik o podanej strukturze. ? Dodatkowa operacja wypisania pliku. ? Składnia: PRINT ? Operacja nie posiada żadnego wyjścia. ? Operacja powinna wypisać na standardowe wyjście zawartość danego pliku (oczywiście w postaci zinterpretowanej). ? Dane powinny być wypisane wierszami. Pierwszy wiersz powinien być w postaci: ... ? Kolejne wiersze powinny zawierać kolejne wartości pól (w odpowiedniej kolejności) zapisanie w formacie , czyli np. 'M &38; M' oznacza wartość ?M & M?. Legenda: ? - pole postaci 'łańcuch znaków bez znaku ' , & oraz znaku nowej linii. Znaki ', & oraz nowej linii są zapisywane jako &;' ? Wszelkie nazwy plików, kolumn, etc. są ciągami znaków [a-z] i [A-Z] oraz [0-9] oraz znaku _ o długości maksymalnie 50 znaków. ? oznacza typ danych. Są dwa typy, string ? oznacza łańcuch znaków dowolnej długości oraz int oznacza liczę 32 bitową ze znakiem. Schemat działania aplikacji składa się z następujących kroków: 1. Wczytanie programu. 2. W pętli dla każdej komendy. 3. Wykonaj komendę. Wykonanie każdej komendy polega na: 1. Wczytaniu plików źródłowych do pamięci. 2. Wykonanie komendy w pamięci na danych w pamięci. 3. Zapis danych do plików docelowych. Aplikacja powinna zapisywać wszelkie dane w lokalnym katalogu. Każdy błąd w programie jest krytyczny i powinien przerywać działanie aplikacji. Program powinien być wczytywany ze standardowego wejścia. Wszelkie błędy odczytu/zapisu na dysk są błędami krytycznymi. Struktura danych w plikach dowolna, wg własnych pomysłów. Optymalizacja implementacji komend nie jest priorytetem. Można założyć, że w każdej chwili działania programu całość danych w plikach mieści się w pamięci. W plikach nie może być wartości NULL. Przykład programu: CREATE tabela1 dzial string zarobki int INSERT tabela1 tabela1 'Zarząd' '10000' INSERT tabela1 tabela1 'Zarząd' '15000' INSERT tabela1 tabela1 'Zarząd' '12000' INSERT tabela1 tabela1 'IT' '4000' INSERT tabela1 tabela1 'Administracja' '2000' INSERT tabela1 tabela1 'IT' '4000'INSERT tabela1 tabela1 'Zarząd' '19000' INSERT tabela1 tabela1 'IT' '5000' FILTER tabela2 tabela1 dzial = 'Zarząd' AGREGATE tabela3 tabela2 zarobki SUM zarobki FILTER tabela2 tabela1 dzial = 'IT' AGREGATE tabela4 tabela2 zarobki SUM zarobki JOIN tabela3 tabela3 tabela4 PRINT tabela3 Po wykonaniu programu w tabeli 3 powinny być dwa wiersze. Pierwszy powinien zawierać sumę zarobków zarządu zaś drugi sumę zarobków działu IT. Po wypisaniu na standardowym wyjściu powinno być: zarobki int '56000' '13000' Oficjalne ? wiążące FAQ do zadania. 1. Jakie znaki mogą się pojawić w nazwach plików (plików wejściowych, plikach wyjściowych i plikach do ładowania danych) i nazwach kolumn (kolumny w plikach)? Odp: W nazwach mogą się pojawiać tylko angielskie literki małe (a, b, c, ..., z), angielskie literki duże (A, B, C, ..., Z), cyfry (0, 1, ..., 9) oraz znak podkreślenia ( _ ). Nie może być ani spacji ani polskich znaków. Maksymalna długość to 50 znaków (liczona jako ilość znaków w nazwie). W związku z potencjalnymi problemami z systemem plików, na którym uruchamiany jest program zakłada się, że program może w zakresie rozróżniania wielkości liter w nazwach plików polegać na systemie plików. Czyli jest dopuszczalne, że pliki 'Ala.db', 'ALA.db' i 'ala.DB' odnoszą się w istocie do tego samego pliku i podanie jakiejkolwiek z tych nazw powoduje odczytanie tego samego pliku. Natomiast nie jest dopuszczalne, aby polecenie zapisania pliku 'Ala.db' w istocie zapisywało plik 'ALA.DB', choć jeśli taki plik istnieje to może zostać nadpisany. 2. Jakie znaki mogą się znaleźć w wartościach danych? Odp: Każda wartość jest zapisana w postaci napisu ograniczonego znakami apostrofa (' - znak o kodzie 39). We wnętrzu napisu nie występują znaki apostrofa ( ' ) oraz nowej linii (znaki o kodach 13 i 10). Ponadto każdy znak może być reprezentowany w postaci &; przy czym jest z zakresu od 1 do 255. Co więcej znak & musi być reprezentowany w ten sposób. Np. wartość M'c ma kota &John's ma psa może zostać zapisana jako: 'M&39;c ma kota &38;&13;&10;John&39;s ma psa' albo jako '&77;&39;&99;&32;ma&32;kota &38;&13;&10;John&39;s ma&32;psa'. Natomiast nie poprawne są napisy: 'M&390;c ma kota &38;&13;&10;John's ma psa' (niepoprawne wartość 390 oraz niepoprawny znak ' w środku napisu), 'M&39;c ma kota &&13;&10;John&39;s ma psa' (niepoprawny znak &) oraz 'M&39;c ma kota &38;John&39;s ma psa' (nowa linia w środku napisu). 3. Czy program powinien obsługiwać BOM w plikach i czy powinien obsługiwać pliki zapisane w UTF-8, UTF-16, itd.? Odp: Nie, zakłada się, że program wczytywany ze standardowego wejścia jest zapisany w formacie ASCII, nie zawiera BOM. Pliki danych w komendzie LOAD nie posiadają BOM są zapisane w formacie ASCII. Nie specyfikujemy, w jakim kodowaniu są znaki w aplikacji (np. ISO-8559-1, ISO-8559-2, WINDOWS-1250), ale autor aplikacji powinien być w stanie odpowiedzieć jak kwestia kodowania wpływa na działanie aplikacji. Pliki danych są w pełni zdefiniowane przez aplikację, więc format ich zapisu jest dowolny. 4. Jak aplikacja powinna się zachować w przypadku problemów w czasie wykonania programu? Odp: Aplikacja powinna obsługiwać normalne błędy, które mogą się pojawić w czasie działania aplikacji, czyli np. błędne formaty komend, błędne formaty plików, brak plików i brak praw dostępu do plików. W przypadku natrafienia na problem w czasie wykonania użytkownik powinien zostać poinformowany o charakterze problemu (czyli opis problemu w taki sposób, aby użytkownik zrozumiał i był w stanie coś zaradzić) oraz o miejscu wystąpienia problemu (np. jeśli problem pojawił się przy wykonywaniu komendy, to należy poinformować użytkownika, jakiej komendy dotyczy problem). Po wyświetleniu informacji o błędzie aplikacja powinna zakończyć działanie. 5. Co to znaczy, że komendy w programie powinny być transakcyjne? Odp: Oznacza to, że wykonanie każdej komendy może się powieść lub nie. W przypadku, gdy wykonanie komendy nie powiodło się aplikacja powinna przywrócić stan sprzed rozpoczęcia wykonania komendy. W szczególności oznacza to usunięcie wszelkich plików tymczasowych. Nie dopuszcza się częściowego wykonania komendy polegającego np. na częściowym załadowaniu danych w komendzie LOAD albo częściowej agregacji danych w komendzie AGREGATE. 6. Czy lista w poleceniu CREATE może być pusta czy tez nie? Innymi słowy czy możemy stworzyć plik bez żadnych kolumn? Odp: Nie. W poleceniu CREATE lista kolumn musi zawierać co najmniej jeden element.7. Czy w operacje w poleceniu AGREGATE (max, min) w przypadku gdy plik/tabelka są puste mogą zwracać 0? Czy bardziej należy rozumieć to jako błąd (nie ma wierszy więc taka operacja liczenia max wartości z jakiejś kolumny jest w ogóle niemożliwa)? Odp: Polecenie powinno powodować błąd w przypadku, gdy operacja nie ma sensu. Operacje suma i średnia (SUM i AVG) mają sens tylko dla kolumn typu liczbowego. Operacje MIN, MAX i COUNT mogą być wykonane dla kolumny dowolnego typu. W przypadku MIN i MAX dla tekstów należy użyć tej samej relacji porządkowania tekstów co w poleceniu FILTER. Ponadto operacje MIN, MAX oraz AVG mają sens tylko dla niepustego zbioru. Operacje COUNT oraz SUM mają sens zarówno dla zbioru pustego jak i niepustego. W przypadku zbioru pustego zarówno COUNT jak i SUM zwraca 0. 8. Czy wartość '' jest dozwolona i co reprezentuje? Odp: Taka wartość jest poprawna i reprezentuje napis długości 0 znaków (pusty napis). 9. Czy w operacji PRINT wartości powinny być wyświetlane w postaci zinterpretowanej i co to oznacza? Odp: Tak, PRINT powinien wyświetlać wartości w postaci zinterpretowanej. Oznacza to, że sekwencje znaków, które kodują inny znak, np. &38;, powinny być napisane jako znak, który kodują a nie sekwencja kodująca. Np. napis 'M &38; M' powinien być przez PRINT wypisany jako 'M & M. 10. Czy operacja FILTER działa na tekstach? Odp: Tak. 11. Czy jest w jakikolwiek sposób określone w jaki sposób aplikacja powinna wewnętrznie przechowywać wartości? Odp: Nie. Aplikacja wewnętrznie może przechowywać wartości jakkolwiek. Oczywiście wewnętrzna reprezentacja może ułatwić lub utrudnić implementację wymaganych operacji na danych. Decyzja całkowicie należy do programisty. 12. Czy można założyć, ze w poleceniu FILTER operacja jest otoczona białymi znakami? Innymi słowy czy np. dzial='12343' (bez spacji oddzielających) przechodzi czy możemy wywalić błąd? Odp: Aplikacja powinna przyjmować co najmniej programy, które posiadają pojedynczą spację pomiędzy elementami komendy. Czyli np. FILTER a b test = '15'. Dodatkowym atutem aplikacji będzie akceptowanie dowolnej ilości znaków białych pomiędzy elementami komendy. Zaś akceptowanie w miejscach, gdzie jest to możliwe, komend bez spacji jest cechą aplikacji bardzo dobrych. To samo dotyczy wszystkich komend a nie tylko komendy FILTER. 13. W zadaniu w opisie polecenia AGREGATE ostatnia linijka mówi: ?Wynikowy plik ma strukturę złożoną z jednej kolumny o podanej nazwie TYPU INT". Czy należy rozumieć, że plik stworzony przez AGREGATE może mieć w wyniku zarówno int jak i string? Odp: Tak, w treści zadania jest błąd. Odpowiedź na pytanie 7 jest wiążąca i jej skutkiem jest to, że w wyniku operacji AGREGATE z funkcją MIN lub MAX na kolumnie typu string w pliku, wynikowym powstaje kolumna typu string. 14. Jakie mogą być typy wynikowe kolumny w operacji AGREGATE? Odp: Dla funkcji COUNT, SUM i AVG wynikowa kolumna ma typ int. Dla funkcji MIN i MAX typu kolumny wynikowej jest taki sam jak typ kolumny, na której jest wykonywana funkcja. Oczywiście powyższe ustalenia mają sens tylko wtedy, gdy operacja ma sens, czyli tylko w sytuacja, które opisuje odpowiedź na pytanie 7. 15. Kiedy jest termin oddania zadania zaliczeniowego? Odp: Ostateczny termin oddania mija 15 grudnia (2008-12-15). Programy oddanie po tym terminie nie będą rozpatrywane. Zaleca się, aby oddać program przed ostatnimi zajęciami, aby była szansa rozmowy na temat programu na ostatnich zajęciach. 16. Czy możemy milcząco założyć, że wewnątrz pliku mogą się pojawiać tylko takie znaki jak wymieniono tj. spacje, A-Za-z_0-9 oraz pomocnicze znaki & ; oraz apostrofy ' ' okalające wartość. Czy musimy to sprawdzać? Odp: Zdecydowanie nie. W pliku mogą się pojawić wszystkie znaki o kodach ASCII od 0 do 255. Trzeba rozróżnić dwie kwestie, specyfikację poprawności wejścia i założenie, że wejście jest zgodne ze specyfikacją. W naszym zadaniu jest wyspecyfikowane jakie wejście jest poprawne, ale nie ma założenia, że dane na wejściu spełniają tą specyfikację. Oczywiście jeśli dane na wejściu są niepoprawne to użytkownik powinien dostać odpowiedni komunikat. 17. Tak naprawdę nie widzę różnicy między operacją JOIN a LOAD. Z tego co widzę to operacja LOAD robi to samo co JOIN. Czy różnica polega na tym ze LOAD łączy dwa pliki: plik1 i plik2 w wynikowy plik1. Natomiast JOIN łączy plik1 i plik2 w nowy plik wynikowy plik3. Czy poprawnie to rozumiem? Odp: Źle rozumiesz. Chodzi o to, że specyfikacja w żaden sposób nie opisuje formatu wewnętrznego plików, na których operuje program (chodzi o pliki źródłowe/wynikowe we wszystkich komendach). Więc JOIN w istocie robi to samo co LOAD, ale w komendzie LOAD plik, z którego dane są ładowane ma określony format (być może inny niż pliki z danymi, być może taki sam, to zależy od programisty). 18. Czy w operacji FILTER i AGREGATE może się zdarzyć sytuacja, że plikiem wynikowym będzie plik, z którego biorę dane do przetworzenia, czyli na przykład: AGREGATE plik1 plik1 zarobki SUM zarobki, czy zawsze to będzie nowy plik? Odp: Nie ma żadnych założeń, czy jest to inny czy ten sam plik, więc może być inny i może być ten sam. Więcej informacji, patrz odpowiedź na pytanie 5. 19. Operacja JOIN i MERGE może mieć więcej niż dwie tabele do połączenia/zsumowania, na przykład: JOIN ... ? Odp: Nie, specyfikacja mówi, że operacja łączy dokładnie dwie tabele. 20. Czy w wartościach pól mogą pojawić się polskie literki? Odp: Tak. Trzeba widzieć różnice pomiędzy wartościami a nazwami. Wartości występują wszędzie tam, gdzie dodajemy dane np. do kolumny, przy filtrowaniu, itp. Np. w INSERT tabela1 tabela1 'Zarząd' '1000' tabela1 to nazwa tabeli zaś 'Zarząd' to wartość. W wartościach mogą występować polskie literki jak i inne dziwne znaki np. %, $, /, [, ], itd. itd. zaś w nazwach (kolumn, plików) mogą występować tylko i wyłącznie normalne znaki tak jak to mówi specyfikacja, czyli [a-z] i [A-Z] oraz [0-9] oraz znak _.
A oto rozwiązanie:
include include include include include define round(x) (x<0?ceil((x)-0.5):floor((x)+0.5)) const int ERR_FILE=1; const int ERR_LAST_TYPE_MISSING=2; const int ERR_BAD_TYPE=3; const int ERR_NUM_ROWS=4; const int ERR_NAME=5; const int ERR_TYPE=6; const int ERR_NUM_COL=7; const int ERR_AGGR=8; const int ERR_AMP=9; const int ERR_ASCII=10; const int ERR_APO=11; const int ERR_NAME_LEN=12; const int ERR_NAME_CHAR=13; const int ERR_COMM=14; using namespace std; int str2int(string wartosc) { int liczba=0; for(int i=0;i='0')&&(wartosc[i]<='9')) { liczba=liczba*10+(wartosc[i]-'0'); } } return liczba; } void my_itoa(int value, string& buf, int base){ int i = 30; buf = ""; for(; value && i ; --i, value /= base) buf = "0123456789abcdef"[value % base] + buf; } string AsciiEncode(string wartosc_string) { string zwroc=""; //zamieniamy ' & ; n for(int i=0;i") { if(typ=="int") { if(wartosc_int>liczba) { wynik=1; } } else { if(wartosc_string>wartosc) { wynik=1; } } } else if(operacja==">=") { if(typ=="int") { if(wartosc_int>=liczba) { wynik=1; } } else { if(wartosc_string>=wartosc) { wynik=1; } } } else if(operacja=="<=") { if(typ=="int") { if(wartosc_int<=liczba) { wynik=1; } } else { if(wartosc_string<=wartosc) { wynik=1; } } } else if(operacja=="=") { if(typ=="int") { if(wartosc_int==liczba) { wynik=1; } } else { if(wartosc_string==wartosc) { wynik=1; } } } else if(operacja=="!=") { if(typ=="int") { if(wartosc_int!=liczba) { wynik=1; } } else { if(wartosc_string!=wartosc) { wynik=1; } } } else if(operacja=="<") { if(typ=="int") { if(wartosc_int<liczba) { wynik=1; } } else { if(wartosc_string<wartosc) { wynik=1; } } } else { wynik=-1; //nieznany operator. } return wynik; } string Wypisz_typ() { return nazwa+" "+typ; } string Wypisz(int zamien) { string zwroc=""; if(zamien) { zwroc=AsciiEncode(wartosc_string); } else { zwroc=wartosc_string; } return "'"+zwroc+"'"; } }; // Koniec klasy Pole. //Klasy reprezentujace wiersze tabel class Wiersz { public: vector pola; Wiersz(vector dane) : pola(dane){} Wiersz() {} string Wypisz(int zamien) { string wypisz=""; int ile=pola.size(); for(int i=0;i0) { wypisz+=pola.at(ile-1).Wypisz(zamien); } return wypisz; } }; // Koniec klasy Wiersz. //Klasa reprezentujaca tabele z danymi. class Tabela { public: vector wiersze; vector typy; void Czysc() { wiersze.clear(); typy.clear(); } Pole Agreguj(string funkcja,string kolumna) { int kol=Kolumna(kolumna); Pole wynik; int suma=0; int min=0; int max=0; string min_str=""; string max_str=""; if(kol==-1) { wynik.typ="blad"; } else { min=wiersze.at(0).pola.at(kol).wartosc_int; max=min; min_str=wiersze.at(0).pola.at(kol).wartosc_string; max_str=min_str; for(int i=0;i<wiersze.size();i++) { suma+=wiersze.at(i).pola.at(kol).wartosc_int; //min if(wiersze.at(i).pola.at(kol).wartosc_int<min) { min=wiersze.at(i).pola.at(kol).wartosc_int; } if(wiersze.at(i).pola.at(kol).wartosc_stringmax) { max=wiersze.at(i).pola.at(kol).wartosc_int; } if(wiersze.at(i).pola.at(kol).wartosc_string>max_str) { max_str=wiersze.at(i).pola.at(kol).wartosc_string; } } if(funkcja=="COUNT") { wynik.wartosc_int=wiersze.size(); my_itoa(wiersze.size(),wynik.wartosc_string,10); wynik.typ="int"; } else if(funkcja=="MAX") { wynik.typ=typy.at(kol).typ; if(wynik.typ=="int") { wynik.wartosc_int=max; my_itoa(max,wynik.wartosc_string,10); } else { wynik.wartosc_string=max; } } else if(funkcja=="MIN") { wynik.typ=typy.at(kol).typ; if(wynik.typ=="int") { wynik.wartosc_int=min; my_itoa(max,wynik.wartosc_string,10); } else { wynik.wartosc_string=min; } } else if((funkcja=="AVG")&&(typy.at(kol).typ=="int")) { wynik.typ="int"; wynik.wartosc_int=round(suma/wiersze.size()); my_itoa(wynik.wartosc_int,wynik.wartosc_string,10); } else if((funkcja=="SUM")&&(typy.at(kol).typ=="int")) { wynik.typ="int"; wynik.wartosc_int=suma; my_itoa(wynik.wartosc_int,wynik.wartosc_string,10); } else { wynik.typ="blad";//blad. } } return wynik; } int Kolumna(string nazwa) //zwraca numer kolumny. { int znalezione=-1; //blad. for(int i=0;i<typy.size();i++) { if(typy.at(i).nazwa==nazwa) { znalezione=i; break; } } return znalezione; } int Filtruj(string kolumna, string operacja, string wartosc) { int blad=0; int kol=Kolumna(kolumna); if(kol!=-1) { for(int i=0;i<wiersze.size();i++) { int odp=wiersze.at(i).pola.at(kol).Porownaj(operacja,wartosc); if(odp==-1) { blad=61; //zly operator. break; } else if(odp==0) { wiersze.erase(wiersze.begin()+i,wiersze.begin()+i+1); i=i-1; } } } else { blad=51; //nie ma takiej kolumny. } return blad; } int Serializuj(string nazwa) { int blad=0; fstream plik; plik.open((nazwa+"_data.txt").c_str(),ios::out); if(plik.good()) { plik<<"CREATE "<<nazwa<<" "; //zapisujemy. //Najpierw typy. for(int i=0;i<typy.size();i++) { plik<<"'"<<typy.at(i).nazwa<<"' "<<typy.at(i).typ<<" "; } plik<<"n"; //Teraz dane. for(int i=0;i<wiersze.size();i++) { plik<<"INSERT "<<nazwa<<" "<<nazwa<<" "<<wiersze.at(i).Wypisz(1)<<"n"; } plik.close(); } else { blad=41;//nie ma dostepu do pliku. } return blad; } int Dodaj(vector pola) { Wiersz w; w.pola=pola; wiersze.push_back(w); return 0; } int Utworz(vector typ,int poczatek) { int blad=0; for(int i=poczatek;i<typ.size();i+=2) { typy.push_back(Pole(typ.at(i),typ.at(i+1),"1")); } return blad; } int Wstaw(vector dane,int poczatek)/////////////////////// { int blad=0; vector tmp; if(dane.size()-poczatek==typy.size()) { for(int i=poczatek;i<dane.size();i++) { Pole tymczas=Pole(typy.at(i-poczatek).nazwa,typy.at(i-poczatek).typ,dane.at(i)); tmp.push_back(tymczas); } if(blad==0) { Dodaj(tmp); } } else { blad=11; //Niepoprawna ilosc danych } return blad; } void Wypisz() { //Wypisujemy typy for(int i=0;i<typy.size();i++) { cout<<typy.at(i).Wypisz_typ()<<" "; } cout<<"n"; //Teraz wiersze int ile=wiersze.size(); for(int i=0;i<ile;i++) { cout<<wiersze.at(i).Wypisz(0)<<"n"; } } }; // Koniec klasy tabela. class Parser { private: vector klucze; string komenda; public: int blad; //Kod bledu. Tabela tabelka1; Tabela tabelka2; Parser() : blad(0){} void Czysc() { tabelka1.Czysc(); tabelka2.Czysc(); klucze.clear(); komenda=""; } int Wczytuj(string nazwa) { fstream plik; plik.open((nazwa+"_data.txt").c_str(),ios::in); if(plik.good()) { string dane; while(getline(plik,dane)) { Wykonaj(dane); } plik.close(); } else { blad=ERR_FILE; cout<<"Problem z plikiem wejsciowym n-----n"<<komenda; throw(ERR_FILE); } return blad; } Tabela Deserializuj(string nazwa) { Parser pars; blad=pars.Wczytuj(nazwa); return pars.tabelka1; } int Insert() { Nazwa(1); Nazwa(2); tabelka1=Deserializuj(klucze.at(2)); blad=tabelka1.Wstaw(klucze,3); if(blad==0) { blad=tabelka1.Serializuj(klucze.at(1)); } return blad; } int Create() { for(int i=2;iklucze.size()-1) { cout<<"Brak typu ostatnigon-------n"<<komenda; blad=ERR_LAST_TYPE_MISSING; throw(blad); } else if((klucze.at(i+1)!="string")&&(klucze.at(i+1)!="int")) { cout<<"Nieprawidlowy typn-------n"<<komenda; blad=ERR_BAD_TYPE; //Nieprawidlowy typ. throw(blad); } } if(blad==0) { blad=tabelka1.Utworz(klucze,2); } if(blad==0) { blad=tabelka1.Serializuj(klucze.at(1)); } return blad; } int Filter() { //Filtruje. //Czytamy tabele do przefiltrowania tabelka1=Deserializuj(klucze.at(2)); //Usuwamy niepasujace wiersze blad=tabelka1.Filtruj(klucze.at(3),klucze.at(4),klucze.at(5)); //Zapisujemy: blad=tabelka1.Serializuj(klucze.at(1)); return blad; } int Load() { //Laduje dane. Parser parserek; string wiersz; //Otwieramy plik: fstream plik; tabelka1=Deserializuj(klucze.at(2)); if (blad==0) { plik.open(klucze.at(3).c_str(),ios::in); if(plik.good()) { //Zwalimy robote na juz napisana funkcje: while((blad==0)&&(getline(plik,wiersz))) { blad=parserek.Przetworz(wiersz); if(blad==0) { blad=tabelka1.Wstaw(parserek.klucze,0); } } if(blad==0) { blad=tabelka1.Serializuj(klucze.at(1)); } } else { cout<<"Problem z plikiem wejsciowym n-----n"<<komenda; blad=ERR_FILE; throw(blad); } } else { cout<<"Problem z plikiem wejsciowym n-----n"<<komenda; blad=ERR_FILE; throw(blad); } return blad; } int Merge() { tabelka1=Deserializuj(klucze.at(2)); if(blad==0) { tabelka2=Deserializuj(klucze.at(3)); if(blad!=0) { } else if(tabelka1.wiersze.size()==tabelka2.wiersze.size()) { for(int i=0;i<tabelka1.typy.size();i++) { if(tabelka1.typy.at(i).nazwa==tabelka2.typy.at(i).nazwa) { blad=72;//taka sama nazwa. break; } } if(blad==0) { //Dopisujemy typy tabelka1.typy.insert(tabelka1.typy.end(),tabelka2.typy.begin(),tabelka2.typy.end()); //Dopisujemy kolumny. for(int i=0;i<tabelka2.wiersze.size();i++) { tabelka1.wiersze.at(i).pola.insert(tabelka1.wiersze.at(i).pola.end(),tabelka2.wiersze.at(i).pola.begin(),tabelka2.wiersze.at(i).pola.end()); } //zapisujemy: tabelka1.Serializuj(klucze.at(1)); } } else { cout<<"Zła liczba wierszy n-----n"<<komenda; blad=ERR_NUM_ROWS; throw(blad); } } return blad; } int Join() { tabelka1=Deserializuj(klucze.at(2)); if(blad==0) { tabelka2=Deserializuj(klucze.at(3)); if(blad!=0) { } else if(tabelka1.typy.size()==tabelka2.typy.size()) { for(int i=0;i<tabelka1.typy.size();i++) { if(tabelka1.typy.at(i).nazwa!=tabelka2.typy.at(i).nazwa) { cout<<"Zła nazwa n-----n"<<komenda; blad=ERR_NAME; throw(blad); } else if(tabelka1.typy.at(i).typ!=tabelka2.typy.at(i).typ) { cout<<"Zły typ n-----n"<<komenda; blad=ERR_TYPE; throw(blad); } } if(blad==0) { //Dopisujemy wiersze. for(int i=0;i<tabelka2.wiersze.size();i++) { tabelka1.wiersze.push_back(tabelka2.wiersze.at(i)); } //zapisujemy: tabelka1.Serializuj(klucze.at(1)); } } else { cout<<"Zła liczba kolumn n-----n"<<komenda; blad=ERR_NUM_COL; throw(blad); } } return blad; } int Agregate() { tabelka1=Deserializuj(klucze.at(2)); Pole wynik=tabelka1.Agreguj(klucze.at(4),klucze.at(5)); if(wynik.typ=="blad") { cout<<"Problem agregacji n-----n"<<komenda; blad=ERR_AGGR; throw(blad); } else { wynik.nazwa=klucze.at(3); //Tworzymy tabelke z wynikiem. vector tmp; tmp.push_back(wynik); tabelka2.typy=tmp; tabelka2.Dodaj(tmp); tabelka2.Serializuj(klucze.at(1)); } return blad; } int Print() { tabelka1=Deserializuj(klucze.at(1)); tabelka1.Wypisz(); return blad; } int Przetworz(string polecenie) //Przetwarza polecenia na wektor z tokenami. { komenda=polecenie; polecenie.insert(polecenie.end(), 1, ' ');//spacja na koniec. int ile=polecenie.length(); string teraz=""; string tmp; int otwarty=0; // otwarty apostrof. int kod=0; klucze.clear(); //Przetwarzamy polecenie litera po literze. for(int i=0;i<ile;i++) { if(polecenie[i]=='&') { kod=0; //zamieniamy na ascii. i++; while((polecenie[i]!=';')&&(i<ile)) { kod=kod*10+(polecenie[i]-'0'); i++; } if(i==ile) { cout<<"Niedokończone & n-----n"<<komenda; blad=ERR_AMP; throw(blad); } else if((kod255)) { cout<<"Zły kod ASCII n-----n"<0) { klucze.push_back(teraz); teraz=""; } } else { teraz.insert(teraz.end(), 1, polecenie[i]); } } if(otwarty==1) { cout<<"Niedokończony apostrof n-----n"<50) { cout<<"Za długa nazwa n-----n"<<komenda; blad=ERR_NAME_LEN; throw(blad); } else { for(int i=0;i='a')&&(tmp[i]='A')&&(tmp[i]='0')&&(tmp[i]<='9')))) { cout<<"Zły znak w nazwie n-----n"<<komenda; blad=ERR_NAME_CHAR; throw(blad); } } } } return blad; } int Zrob() { if(klucze.at(0)=="INSERT") { blad=Insert(); } else if(klucze.at(0)=="CREATE") { blad=Create(); } else if(klucze.at(0)=="FILTER") { blad=Filter(); } else if(klucze.at(0)=="AGREGATE") { blad=Agregate(); } else if(klucze.at(0)=="JOIN") { blad=Join(); } else if(klucze.at(0)=="PRINT") { blad=Print(); } else if(klucze.at(0)=="MERGE") { blad=Merge(); } else if(klucze.at(0)=="LOAD") { blad=Load(); } else { cout<<"Nieznana komenda n-----n"<<komenda; blad=ERR_COMM; throw(blad); } return blad; } int Wykonaj(string polecenie) { Przetworz(polecenie); if(blad==0) { Zrob(); } return blad; } }; // Koniec klasy Parser. int main() { Parser pars; string wiersz; int blad=0; while((blad==0)&&(getline(cin,wiersz))) { pars.Wykonaj(wiersz); blad=pars.blad; pars.Czysc(); } return 0; }