Zadanie z laboratorium programowania C++ na Informatyce UW.
Program zaliczeniowy ? wersja finalna ? 2008-10-23.
Program zaliczeniowy polega na napisaniu aplikacji w C++. Celem aplikacji jest wykonywanie prostych
programów na danych.
Programem nazywamy listę kolejnych operacji na danych.
Każdy program jest postaci:
operacja
operacja
....
operacja
Każda operacja jest pewnym przekształceniem plików z danymi.
Są dostępne następujące operacje:
? Operacja filtrowania
? Składania: FILTER .
? =, !=, >, =, <=.
? Schemat pliku wynikowego jest taki sam jak źródłowego.
? Operacja dołączenia
? Składnia: MERGE
? Operacja polega na zsumowaniu kolumn plików 1 i 2.
? Operacja powiedzie się jeśli kolumny plików 1 i 2 mają inne nazwy oraz ilość wierszy w pliku 1 i
w pliku 2 jest taka sama.
? Wynikowy plik ma wszystkie kolumny pliku 1 i wszystkie kolumny pliku 2.
? Operacja łączenia
? Składnia: JOIN
? Operacja polega na wypisaniu do pliku docelowego najpierw zawartości pliku1 a za nim pliku2.
? Operacja jest wykonalna tylko i wyłącznie, gdy ilość kolumn pliku1 i pliku2 jest taka sama i typy
kolejnych kolumn są takie same.
? Wynikowy plik ma schemat taki sam jak plik1.
? Operacja wyliczenia
? Składnia: AGREGATE
? oznacza operację z listy: maksimum [MAX], minimum [MIN], suma [SUM], średnia
[AVG] (zaokrąglenie do int'a), ilość [COUNT].
? Operacja powiedzie się jeśli typ danych jest zgodny z operacją.
? Wynikowy plik ma strukturę złożoną z jednej kolumny o podanej nazwie typu int oraz zawiera
jeden wiersz z wynikiem operacji.
? Operacja dodania danych.
? Składnia: INSERT ...
? Operacja dodaje wiersz danych na końcu pliku danych.
? Operacja się powiedzie jeśli ilość danych zgadza się z listą kolumn oraz typu danych się
zgadzają.
? Operacja ładowania danych.
? Składnia: LOAD
? Operacja odczytuje linia po linii dane z pliku wejściowego i dopisuje je na końcu wskazanego
pliku.
? Dane w pliku z danymi są zapisane linia po linii.
? Każda linia zawiera jeden rekord danych.? Każda linia zawiera pewną ilość pól postaci ...
? Każda wartość jest zapisana w formacie wartości przyjmowanym we wszystkich
komendach.
? Operacja się powiedzie jeśli ilość danych zgadza się z listą kolumn oraz typu danych się
zgadzają.
? Operacja stworzenia pustego pliku.
? Składnia: CREATE ...
? Operacja tworzy pusty plik o podanej strukturze.
? Dodatkowa operacja wypisania pliku.
? Składnia: PRINT
? Operacja nie posiada żadnego wyjścia.
? Operacja powinna wypisać na standardowe wyjście zawartość danego pliku (oczywiście w
postaci zinterpretowanej).
? Dane powinny być wypisane wierszami. Pierwszy wiersz powinien być w postaci: ...
? Kolejne wiersze powinny zawierać kolejne wartości pól (w odpowiedniej kolejności) zapisanie w
formacie , czyli np. 'M &38; M' oznacza wartość ?M & M?.
Legenda:
? - pole postaci 'łańcuch znaków bez znaku ' , & oraz znaku nowej linii. Znaki ', & oraz
nowej linii są zapisywane jako &;'
? Wszelkie nazwy plików, kolumn, etc. są ciągami znaków [a-z] i [A-Z] oraz [0-9] oraz znaku _ o
długości maksymalnie 50 znaków.
? oznacza typ danych. Są dwa typy, string ? oznacza łańcuch znaków dowolnej długości oraz
int oznacza liczę 32 bitową ze znakiem.
Schemat działania aplikacji składa się z następujących kroków:
1. Wczytanie programu.
2. W pętli dla każdej komendy.
3. Wykonaj komendę.
Wykonanie każdej komendy polega na:
1. Wczytaniu plików źródłowych do pamięci.
2. Wykonanie komendy w pamięci na danych w pamięci.
3. Zapis danych do plików docelowych.
Aplikacja powinna zapisywać wszelkie dane w lokalnym katalogu. Każdy błąd w programie jest
krytyczny i powinien przerywać działanie aplikacji. Program powinien być wczytywany ze
standardowego wejścia. Wszelkie błędy odczytu/zapisu na dysk są błędami krytycznymi. Struktura
danych w plikach dowolna, wg własnych pomysłów. Optymalizacja implementacji komend nie jest
priorytetem. Można założyć, że w każdej chwili działania programu całość danych w plikach mieści się
w pamięci. W plikach nie może być wartości NULL.
Przykład programu:
CREATE tabela1 dzial string zarobki int
INSERT tabela1 tabela1 'Zarząd' '10000'
INSERT tabela1 tabela1 'Zarząd' '15000'
INSERT tabela1 tabela1 'Zarząd' '12000'
INSERT tabela1 tabela1 'IT' '4000'
INSERT tabela1 tabela1 'Administracja' '2000'
INSERT tabela1 tabela1 'IT' '4000'INSERT tabela1 tabela1 'Zarząd' '19000'
INSERT tabela1 tabela1 'IT' '5000'
FILTER tabela2 tabela1 dzial = 'Zarząd'
AGREGATE tabela3 tabela2 zarobki SUM zarobki
FILTER tabela2 tabela1 dzial = 'IT'
AGREGATE tabela4 tabela2 zarobki SUM zarobki
JOIN tabela3 tabela3 tabela4
PRINT tabela3
Po wykonaniu programu w tabeli 3 powinny być dwa wiersze. Pierwszy powinien zawierać sumę
zarobków zarządu zaś drugi sumę zarobków działu IT.
Po wypisaniu na standardowym wyjściu powinno być:
zarobki int
'56000'
'13000'
Oficjalne ? wiążące FAQ do zadania.
1. Jakie znaki mogą się pojawić w nazwach plików (plików wejściowych, plikach wyjściowych i
plikach do ładowania danych) i nazwach kolumn (kolumny w plikach)?
Odp: W nazwach mogą się pojawiać tylko angielskie literki małe (a, b, c, ..., z), angielskie literki
duże (A, B, C, ..., Z), cyfry (0, 1, ..., 9) oraz znak podkreślenia ( _ ). Nie może być ani spacji ani
polskich znaków. Maksymalna długość to 50 znaków (liczona jako ilość znaków w nazwie). W
związku z potencjalnymi problemami z systemem plików, na którym uruchamiany jest program
zakłada się, że program może w zakresie rozróżniania wielkości liter w nazwach plików polegać
na systemie plików. Czyli jest dopuszczalne, że pliki 'Ala.db', 'ALA.db' i 'ala.DB' odnoszą się w
istocie do tego samego pliku i podanie jakiejkolwiek z tych nazw powoduje odczytanie tego
samego pliku. Natomiast nie jest dopuszczalne, aby polecenie zapisania pliku 'Ala.db' w istocie
zapisywało plik 'ALA.DB', choć jeśli taki plik istnieje to może zostać nadpisany.
2. Jakie znaki mogą się znaleźć w wartościach danych?
Odp: Każda wartość jest zapisana w postaci napisu ograniczonego znakami apostrofa (' - znak
o kodzie 39). We wnętrzu napisu nie występują znaki apostrofa ( ' ) oraz nowej linii (znaki o
kodach 13 i 10). Ponadto każdy znak może być reprezentowany w postaci &; przy
czym jest z zakresu od 1 do 255. Co więcej znak & musi być reprezentowany w ten
sposób. Np. wartość M'c ma kota &John's ma psa może zostać zapisana jako:
'M&39;c ma kota &38;&13;&10;John&39;s ma psa' albo jako '&77;&39;&99;&32;ma&32;kota
&38;&13;&10;John&39;s ma&32;psa'. Natomiast nie poprawne są napisy: 'M&390;c ma kota
&38;&13;&10;John's ma psa' (niepoprawne wartość 390 oraz niepoprawny znak ' w środku
napisu), 'M&39;c ma kota &&13;&10;John&39;s ma psa' (niepoprawny znak &) oraz 'M&39;c
ma kota &38;John&39;s ma psa' (nowa linia w środku napisu).
3. Czy program powinien obsługiwać BOM w plikach i czy powinien obsługiwać pliki zapisane w
UTF-8, UTF-16, itd.?
Odp: Nie, zakłada się, że program wczytywany ze standardowego wejścia jest zapisany w
formacie ASCII, nie zawiera BOM. Pliki danych w komendzie LOAD nie posiadają BOM są
zapisane w formacie ASCII. Nie specyfikujemy, w jakim kodowaniu są znaki w aplikacji (np.
ISO-8559-1, ISO-8559-2, WINDOWS-1250), ale autor aplikacji powinien być w stanie
odpowiedzieć jak kwestia kodowania wpływa na działanie aplikacji. Pliki danych są w pełni
zdefiniowane przez aplikację, więc format ich zapisu jest dowolny.
4. Jak aplikacja powinna się zachować w przypadku problemów w czasie wykonania programu?
Odp: Aplikacja powinna obsługiwać normalne błędy, które mogą się pojawić w czasie działania
aplikacji, czyli np. błędne formaty komend, błędne formaty plików, brak plików i brak praw
dostępu do plików. W przypadku natrafienia na problem w czasie wykonania użytkownik
powinien zostać poinformowany o charakterze problemu (czyli opis problemu w taki sposób,
aby użytkownik zrozumiał i był w stanie coś zaradzić) oraz o miejscu wystąpienia problemu (np.
jeśli problem pojawił się przy wykonywaniu komendy, to należy poinformować użytkownika,
jakiej komendy dotyczy problem). Po wyświetleniu informacji o błędzie aplikacja powinna
zakończyć działanie.
5. Co to znaczy, że komendy w programie powinny być transakcyjne?
Odp: Oznacza to, że wykonanie każdej komendy może się powieść lub nie. W przypadku, gdy
wykonanie komendy nie powiodło się aplikacja powinna przywrócić stan sprzed rozpoczęcia
wykonania komendy. W szczególności oznacza to usunięcie wszelkich plików tymczasowych.
Nie dopuszcza się częściowego wykonania komendy polegającego np. na częściowym
załadowaniu danych w komendzie LOAD albo częściowej agregacji danych w komendzie
AGREGATE.
6. Czy lista w poleceniu CREATE może być pusta czy tez nie? Innymi słowy
czy możemy stworzyć plik bez żadnych kolumn?
Odp: Nie. W poleceniu CREATE lista kolumn musi zawierać co najmniej jeden element.7. Czy w operacje w poleceniu AGREGATE (max, min) w przypadku gdy plik/tabelka są puste
mogą zwracać 0? Czy bardziej należy rozumieć to jako błąd (nie ma wierszy więc taka operacja
liczenia max wartości z jakiejś kolumny jest w ogóle niemożliwa)?
Odp: Polecenie powinno powodować błąd w przypadku, gdy operacja nie ma sensu. Operacje
suma i średnia (SUM i AVG) mają sens tylko dla kolumn typu liczbowego. Operacje MIN, MAX
i COUNT mogą być wykonane dla kolumny dowolnego typu. W przypadku MIN i MAX dla
tekstów należy użyć tej samej relacji porządkowania tekstów co w poleceniu FILTER. Ponadto
operacje MIN, MAX oraz AVG mają sens tylko dla niepustego zbioru. Operacje COUNT oraz
SUM mają sens zarówno dla zbioru pustego jak i niepustego. W przypadku zbioru pustego
zarówno COUNT jak i SUM zwraca 0.
8. Czy wartość '' jest dozwolona i co reprezentuje?
Odp: Taka wartość jest poprawna i reprezentuje napis długości 0 znaków (pusty napis).
9. Czy w operacji PRINT wartości powinny być wyświetlane w postaci zinterpretowanej i co to
oznacza?
Odp: Tak, PRINT powinien wyświetlać wartości w postaci zinterpretowanej. Oznacza to, że
sekwencje znaków, które kodują inny znak, np. &38;, powinny być napisane jako znak, który
kodują a nie sekwencja kodująca. Np. napis 'M &38; M' powinien być przez PRINT wypisany
jako 'M & M.
10. Czy operacja FILTER działa na tekstach?
Odp: Tak.
11. Czy jest w jakikolwiek sposób określone w jaki sposób aplikacja powinna wewnętrznie
przechowywać wartości?
Odp: Nie. Aplikacja wewnętrznie może przechowywać wartości jakkolwiek. Oczywiście
wewnętrzna reprezentacja może ułatwić lub utrudnić implementację wymaganych operacji na
danych. Decyzja całkowicie należy do programisty.
12. Czy można założyć, ze w poleceniu FILTER operacja jest otoczona białymi znakami? Innymi
słowy czy np. dzial='12343' (bez spacji oddzielających) przechodzi czy możemy wywalić błąd?
Odp: Aplikacja powinna przyjmować co najmniej programy, które posiadają pojedynczą spację
pomiędzy elementami komendy. Czyli np. FILTER a b test = '15'. Dodatkowym atutem
aplikacji będzie akceptowanie dowolnej ilości znaków białych pomiędzy elementami komendy.
Zaś akceptowanie w miejscach, gdzie jest to możliwe, komend bez spacji jest cechą aplikacji
bardzo dobrych. To samo dotyczy wszystkich komend a nie tylko komendy FILTER.
13. W zadaniu w opisie polecenia AGREGATE ostatnia linijka mówi: ?Wynikowy plik ma strukturę
złożoną z jednej kolumny o podanej nazwie TYPU INT". Czy należy rozumieć, że plik
stworzony przez AGREGATE może mieć w wyniku zarówno int jak i string?
Odp: Tak, w treści zadania jest błąd. Odpowiedź na pytanie 7 jest wiążąca i jej skutkiem jest to,
że w wyniku operacji AGREGATE z funkcją MIN lub MAX na kolumnie typu string w pliku,
wynikowym powstaje kolumna typu string.
14. Jakie mogą być typy wynikowe kolumny w operacji AGREGATE?
Odp: Dla funkcji COUNT, SUM i AVG wynikowa kolumna ma typ int. Dla funkcji MIN i
MAX typu kolumny wynikowej jest taki sam jak typ kolumny, na której jest wykonywana
funkcja. Oczywiście powyższe ustalenia mają sens tylko wtedy, gdy operacja ma sens, czyli tylko
w sytuacja, które opisuje odpowiedź na pytanie 7.
15. Kiedy jest termin oddania zadania zaliczeniowego?
Odp: Ostateczny termin oddania mija 15 grudnia (2008-12-15). Programy oddanie po tym
terminie nie będą rozpatrywane. Zaleca się, aby oddać program przed ostatnimi zajęciami, aby
była szansa rozmowy na temat programu na ostatnich zajęciach.
16. Czy możemy milcząco założyć, że wewnątrz pliku mogą się pojawiać tylko takie znaki jak
wymieniono tj. spacje, A-Za-z_0-9 oraz pomocnicze znaki & ; oraz apostrofy ' ' okalające
wartość. Czy musimy to sprawdzać?
Odp: Zdecydowanie nie. W pliku mogą się pojawić wszystkie znaki o kodach ASCII od 0 do
255. Trzeba rozróżnić dwie kwestie, specyfikację poprawności wejścia i założenie, że wejście jest
zgodne ze specyfikacją. W naszym zadaniu jest wyspecyfikowane jakie wejście jest poprawne, ale nie ma założenia, że dane na wejściu spełniają tą specyfikację. Oczywiście jeśli dane na wejściu
są niepoprawne to użytkownik powinien dostać odpowiedni komunikat.
17. Tak naprawdę nie widzę różnicy między operacją JOIN a LOAD. Z tego co widzę to operacja
LOAD robi to samo co JOIN. Czy różnica polega na tym ze LOAD łączy dwa pliki: plik1 i
plik2 w wynikowy plik1. Natomiast JOIN łączy plik1 i plik2 w nowy plik wynikowy plik3. Czy
poprawnie to rozumiem?
Odp: Źle rozumiesz. Chodzi o to, że specyfikacja w żaden sposób nie opisuje formatu
wewnętrznego plików, na których operuje program (chodzi o pliki źródłowe/wynikowe we
wszystkich komendach). Więc JOIN w istocie robi to samo co LOAD, ale w komendzie LOAD
plik, z którego dane są ładowane ma określony format (być może inny niż pliki z danymi, być
może taki sam, to zależy od programisty).
18. Czy w operacji FILTER i AGREGATE może się zdarzyć sytuacja, że plikiem wynikowym
będzie plik, z którego biorę dane do przetworzenia, czyli na przykład: AGREGATE plik1 plik1
zarobki SUM zarobki, czy zawsze to będzie nowy plik?
Odp: Nie ma żadnych założeń, czy jest to inny czy ten sam plik, więc może być inny i może być
ten sam. Więcej informacji, patrz odpowiedź na pytanie 5.
19. Operacja JOIN i MERGE może mieć więcej niż dwie tabele do połączenia/zsumowania, na
przykład: JOIN ... ?
Odp: Nie, specyfikacja mówi, że operacja łączy dokładnie dwie tabele.
20. Czy w wartościach pól mogą pojawić się polskie literki?
Odp: Tak. Trzeba widzieć różnice pomiędzy wartościami a nazwami. Wartości występują
wszędzie tam, gdzie dodajemy dane np. do kolumny, przy filtrowaniu, itp. Np. w INSERT
tabela1 tabela1 'Zarząd' '1000' tabela1 to nazwa tabeli zaś 'Zarząd' to wartość. W wartościach
mogą występować polskie literki jak i inne dziwne znaki np. %, $, /, [, ], itd. itd. zaś w nazwach
(kolumn, plików) mogą występować tylko i wyłącznie normalne znaki tak jak to mówi
specyfikacja, czyli [a-z] i [A-Z] oraz [0-9] oraz znak _.
A oto rozwiązanie:
include
include
include
include
include
define round(x) (x<0?ceil((x)-0.5):floor((x)+0.5))
const int ERR_FILE=1;
const int ERR_LAST_TYPE_MISSING=2;
const int ERR_BAD_TYPE=3;
const int ERR_NUM_ROWS=4;
const int ERR_NAME=5;
const int ERR_TYPE=6;
const int ERR_NUM_COL=7;
const int ERR_AGGR=8;
const int ERR_AMP=9;
const int ERR_ASCII=10;
const int ERR_APO=11;
const int ERR_NAME_LEN=12;
const int ERR_NAME_CHAR=13;
const int ERR_COMM=14;
using namespace std;
int str2int(string wartosc)
{
int liczba=0;
for(int i=0;i='0')&&(wartosc[i]<='9'))
{
liczba=liczba*10+(wartosc[i]-'0');
}
}
return liczba;
}
void my_itoa(int value, string& buf, int base){
int i = 30;
buf = "";
for(; value && i ; --i, value /= base) buf = "0123456789abcdef"[value % base] + buf;
}
string AsciiEncode(string wartosc_string)
{
string zwroc="";
//zamieniamy ' & ; n
for(int i=0;i")
{
if(typ=="int")
{
if(wartosc_int>liczba)
{
wynik=1;
}
}
else
{
if(wartosc_string>wartosc)
{
wynik=1;
}
}
}
else if(operacja==">=")
{
if(typ=="int")
{
if(wartosc_int>=liczba)
{
wynik=1;
}
}
else
{
if(wartosc_string>=wartosc)
{
wynik=1;
}
}
}
else if(operacja=="<=")
{
if(typ=="int")
{
if(wartosc_int<=liczba)
{
wynik=1;
}
}
else
{
if(wartosc_string<=wartosc)
{
wynik=1;
}
}
}
else if(operacja=="=")
{
if(typ=="int")
{
if(wartosc_int==liczba)
{
wynik=1;
}
}
else
{
if(wartosc_string==wartosc)
{
wynik=1;
}
}
}
else if(operacja=="!=")
{
if(typ=="int")
{
if(wartosc_int!=liczba)
{
wynik=1;
}
}
else
{
if(wartosc_string!=wartosc)
{
wynik=1;
}
}
}
else if(operacja=="<")
{
if(typ=="int")
{
if(wartosc_int<liczba)
{
wynik=1;
}
}
else
{
if(wartosc_string<wartosc)
{
wynik=1;
}
}
}
else
{
wynik=-1; //nieznany operator.
}
return wynik;
}
string Wypisz_typ()
{
return nazwa+" "+typ;
}
string Wypisz(int zamien)
{
string zwroc="";
if(zamien)
{
zwroc=AsciiEncode(wartosc_string);
}
else
{
zwroc=wartosc_string;
}
return "'"+zwroc+"'";
}
}; // Koniec klasy Pole.
//Klasy reprezentujace wiersze tabel
class Wiersz
{
public:
vector pola;
Wiersz(vector dane) : pola(dane){}
Wiersz() {}
string Wypisz(int zamien)
{
string wypisz="";
int ile=pola.size();
for(int i=0;i0)
{
wypisz+=pola.at(ile-1).Wypisz(zamien);
}
return wypisz;
}
}; // Koniec klasy Wiersz.
//Klasa reprezentujaca tabele z danymi.
class Tabela
{
public:
vector wiersze;
vector typy;
void Czysc()
{
wiersze.clear();
typy.clear();
}
Pole Agreguj(string funkcja,string kolumna)
{
int kol=Kolumna(kolumna);
Pole wynik;
int suma=0;
int min=0;
int max=0;
string min_str="";
string max_str="";
if(kol==-1)
{
wynik.typ="blad";
}
else
{
min=wiersze.at(0).pola.at(kol).wartosc_int;
max=min;
min_str=wiersze.at(0).pola.at(kol).wartosc_string;
max_str=min_str;
for(int i=0;i<wiersze.size();i++)
{
suma+=wiersze.at(i).pola.at(kol).wartosc_int;
//min
if(wiersze.at(i).pola.at(kol).wartosc_int<min)
{
min=wiersze.at(i).pola.at(kol).wartosc_int;
}
if(wiersze.at(i).pola.at(kol).wartosc_stringmax)
{
max=wiersze.at(i).pola.at(kol).wartosc_int;
}
if(wiersze.at(i).pola.at(kol).wartosc_string>max_str)
{
max_str=wiersze.at(i).pola.at(kol).wartosc_string;
}
}
if(funkcja=="COUNT")
{
wynik.wartosc_int=wiersze.size();
my_itoa(wiersze.size(),wynik.wartosc_string,10);
wynik.typ="int";
}
else if(funkcja=="MAX")
{
wynik.typ=typy.at(kol).typ;
if(wynik.typ=="int")
{
wynik.wartosc_int=max;
my_itoa(max,wynik.wartosc_string,10);
}
else
{
wynik.wartosc_string=max;
}
}
else if(funkcja=="MIN")
{
wynik.typ=typy.at(kol).typ;
if(wynik.typ=="int")
{
wynik.wartosc_int=min;
my_itoa(max,wynik.wartosc_string,10);
}
else
{
wynik.wartosc_string=min;
}
}
else if((funkcja=="AVG")&&(typy.at(kol).typ=="int"))
{
wynik.typ="int";
wynik.wartosc_int=round(suma/wiersze.size());
my_itoa(wynik.wartosc_int,wynik.wartosc_string,10);
}
else if((funkcja=="SUM")&&(typy.at(kol).typ=="int"))
{
wynik.typ="int";
wynik.wartosc_int=suma;
my_itoa(wynik.wartosc_int,wynik.wartosc_string,10);
}
else
{
wynik.typ="blad";//blad.
}
}
return wynik;
}
int Kolumna(string nazwa)
//zwraca numer kolumny.
{
int znalezione=-1; //blad.
for(int i=0;i<typy.size();i++)
{
if(typy.at(i).nazwa==nazwa)
{
znalezione=i;
break;
}
}
return znalezione;
}
int Filtruj(string kolumna, string operacja, string wartosc)
{
int blad=0;
int kol=Kolumna(kolumna);
if(kol!=-1)
{
for(int i=0;i<wiersze.size();i++)
{
int odp=wiersze.at(i).pola.at(kol).Porownaj(operacja,wartosc);
if(odp==-1)
{
blad=61; //zly operator.
break;
}
else if(odp==0)
{
wiersze.erase(wiersze.begin()+i,wiersze.begin()+i+1);
i=i-1;
}
}
}
else
{
blad=51; //nie ma takiej kolumny.
}
return blad;
}
int Serializuj(string nazwa)
{
int blad=0;
fstream plik;
plik.open((nazwa+"_data.txt").c_str(),ios::out);
if(plik.good())
{
plik<<"CREATE "<<nazwa<<" ";
//zapisujemy.
//Najpierw typy.
for(int i=0;i<typy.size();i++)
{
plik<<"'"<<typy.at(i).nazwa<<"' "<<typy.at(i).typ<<" ";
}
plik<<"n";
//Teraz dane.
for(int i=0;i<wiersze.size();i++)
{
plik<<"INSERT "<<nazwa<<" "<<nazwa<<" "<<wiersze.at(i).Wypisz(1)<<"n";
}
plik.close();
}
else
{
blad=41;//nie ma dostepu do pliku.
}
return blad;
}
int Dodaj(vector pola)
{
Wiersz w;
w.pola=pola;
wiersze.push_back(w);
return 0;
}
int Utworz(vector typ,int poczatek)
{
int blad=0;
for(int i=poczatek;i<typ.size();i+=2)
{
typy.push_back(Pole(typ.at(i),typ.at(i+1),"1"));
}
return blad;
}
int Wstaw(vector dane,int poczatek)///////////////////////
{
int blad=0;
vector tmp;
if(dane.size()-poczatek==typy.size())
{
for(int i=poczatek;i<dane.size();i++)
{
Pole tymczas=Pole(typy.at(i-poczatek).nazwa,typy.at(i-poczatek).typ,dane.at(i));
tmp.push_back(tymczas);
}
if(blad==0)
{
Dodaj(tmp);
}
}
else
{
blad=11; //Niepoprawna ilosc danych
}
return blad;
}
void Wypisz()
{
//Wypisujemy typy
for(int i=0;i<typy.size();i++)
{
cout<<typy.at(i).Wypisz_typ()<<" ";
}
cout<<"n";
//Teraz wiersze
int ile=wiersze.size();
for(int i=0;i<ile;i++)
{
cout<<wiersze.at(i).Wypisz(0)<<"n";
}
}
}; // Koniec klasy tabela.
class Parser
{
private:
vector klucze;
string komenda;
public:
int blad; //Kod bledu.
Tabela tabelka1;
Tabela tabelka2;
Parser() : blad(0){}
void Czysc()
{
tabelka1.Czysc();
tabelka2.Czysc();
klucze.clear();
komenda="";
}
int Wczytuj(string nazwa)
{
fstream plik;
plik.open((nazwa+"_data.txt").c_str(),ios::in);
if(plik.good())
{
string dane;
while(getline(plik,dane))
{
Wykonaj(dane);
}
plik.close();
}
else
{
blad=ERR_FILE;
cout<<"Problem z plikiem wejsciowym n-----n"<<komenda;
throw(ERR_FILE);
}
return blad;
}
Tabela Deserializuj(string nazwa)
{
Parser pars;
blad=pars.Wczytuj(nazwa);
return pars.tabelka1;
}
int Insert()
{
Nazwa(1);
Nazwa(2);
tabelka1=Deserializuj(klucze.at(2));
blad=tabelka1.Wstaw(klucze,3);
if(blad==0)
{
blad=tabelka1.Serializuj(klucze.at(1));
}
return blad;
}
int Create()
{
for(int i=2;iklucze.size()-1)
{
cout<<"Brak typu ostatnigon-------n"<<komenda;
blad=ERR_LAST_TYPE_MISSING;
throw(blad);
}
else if((klucze.at(i+1)!="string")&&(klucze.at(i+1)!="int"))
{
cout<<"Nieprawidlowy typn-------n"<<komenda;
blad=ERR_BAD_TYPE; //Nieprawidlowy typ.
throw(blad);
}
}
if(blad==0)
{
blad=tabelka1.Utworz(klucze,2);
}
if(blad==0)
{
blad=tabelka1.Serializuj(klucze.at(1));
}
return blad;
}
int Filter()
{
//Filtruje.
//Czytamy tabele do przefiltrowania
tabelka1=Deserializuj(klucze.at(2));
//Usuwamy niepasujace wiersze
blad=tabelka1.Filtruj(klucze.at(3),klucze.at(4),klucze.at(5));
//Zapisujemy:
blad=tabelka1.Serializuj(klucze.at(1));
return blad;
}
int Load()
{
//Laduje dane.
Parser parserek;
string wiersz;
//Otwieramy plik:
fstream plik;
tabelka1=Deserializuj(klucze.at(2));
if (blad==0)
{
plik.open(klucze.at(3).c_str(),ios::in);
if(plik.good())
{
//Zwalimy robote na juz napisana funkcje:
while((blad==0)&&(getline(plik,wiersz)))
{
blad=parserek.Przetworz(wiersz);
if(blad==0)
{
blad=tabelka1.Wstaw(parserek.klucze,0);
}
}
if(blad==0)
{
blad=tabelka1.Serializuj(klucze.at(1));
}
}
else
{
cout<<"Problem z plikiem wejsciowym n-----n"<<komenda;
blad=ERR_FILE;
throw(blad);
}
}
else
{
cout<<"Problem z plikiem wejsciowym n-----n"<<komenda;
blad=ERR_FILE;
throw(blad);
}
return blad;
}
int Merge()
{
tabelka1=Deserializuj(klucze.at(2));
if(blad==0)
{
tabelka2=Deserializuj(klucze.at(3));
if(blad!=0)
{
}
else if(tabelka1.wiersze.size()==tabelka2.wiersze.size())
{
for(int i=0;i<tabelka1.typy.size();i++)
{
if(tabelka1.typy.at(i).nazwa==tabelka2.typy.at(i).nazwa)
{
blad=72;//taka sama nazwa.
break;
}
}
if(blad==0)
{
//Dopisujemy typy
tabelka1.typy.insert(tabelka1.typy.end(),tabelka2.typy.begin(),tabelka2.typy.end());
//Dopisujemy kolumny.
for(int i=0;i<tabelka2.wiersze.size();i++)
{
tabelka1.wiersze.at(i).pola.insert(tabelka1.wiersze.at(i).pola.end(),tabelka2.wiersze.at(i).pola.begin(),tabelka2.wiersze.at(i).pola.end());
}
//zapisujemy:
tabelka1.Serializuj(klucze.at(1));
}
}
else
{
cout<<"Zła liczba wierszy n-----n"<<komenda;
blad=ERR_NUM_ROWS;
throw(blad);
}
}
return blad;
}
int Join()
{
tabelka1=Deserializuj(klucze.at(2));
if(blad==0)
{
tabelka2=Deserializuj(klucze.at(3));
if(blad!=0)
{
}
else if(tabelka1.typy.size()==tabelka2.typy.size())
{
for(int i=0;i<tabelka1.typy.size();i++)
{
if(tabelka1.typy.at(i).nazwa!=tabelka2.typy.at(i).nazwa)
{
cout<<"Zła nazwa n-----n"<<komenda;
blad=ERR_NAME;
throw(blad);
}
else if(tabelka1.typy.at(i).typ!=tabelka2.typy.at(i).typ)
{
cout<<"Zły typ n-----n"<<komenda;
blad=ERR_TYPE;
throw(blad);
}
}
if(blad==0)
{
//Dopisujemy wiersze.
for(int i=0;i<tabelka2.wiersze.size();i++)
{
tabelka1.wiersze.push_back(tabelka2.wiersze.at(i));
}
//zapisujemy:
tabelka1.Serializuj(klucze.at(1));
}
}
else
{
cout<<"Zła liczba kolumn n-----n"<<komenda;
blad=ERR_NUM_COL;
throw(blad);
}
}
return blad;
}
int Agregate()
{
tabelka1=Deserializuj(klucze.at(2));
Pole wynik=tabelka1.Agreguj(klucze.at(4),klucze.at(5));
if(wynik.typ=="blad")
{
cout<<"Problem agregacji n-----n"<<komenda;
blad=ERR_AGGR;
throw(blad);
}
else
{
wynik.nazwa=klucze.at(3);
//Tworzymy tabelke z wynikiem.
vector tmp;
tmp.push_back(wynik);
tabelka2.typy=tmp;
tabelka2.Dodaj(tmp);
tabelka2.Serializuj(klucze.at(1));
}
return blad;
}
int Print()
{
tabelka1=Deserializuj(klucze.at(1));
tabelka1.Wypisz();
return blad;
}
int Przetworz(string polecenie)
//Przetwarza polecenia na wektor z tokenami.
{
komenda=polecenie;
polecenie.insert(polecenie.end(), 1, ' ');//spacja na koniec.
int ile=polecenie.length();
string teraz="";
string tmp;
int otwarty=0; // otwarty apostrof.
int kod=0;
klucze.clear();
//Przetwarzamy polecenie litera po literze.
for(int i=0;i<ile;i++)
{
if(polecenie[i]=='&')
{
kod=0;
//zamieniamy na ascii.
i++;
while((polecenie[i]!=';')&&(i<ile))
{
kod=kod*10+(polecenie[i]-'0');
i++;
}
if(i==ile)
{
cout<<"Niedokończone & n-----n"<<komenda;
blad=ERR_AMP;
throw(blad);
}
else if((kod255))
{
cout<<"Zły kod ASCII n-----n"<0)
{
klucze.push_back(teraz);
teraz="";
}
}
else
{
teraz.insert(teraz.end(), 1, polecenie[i]);
}
}
if(otwarty==1)
{
cout<<"Niedokończony apostrof n-----n"<50)
{
cout<<"Za długa nazwa n-----n"<<komenda;
blad=ERR_NAME_LEN;
throw(blad);
}
else
{
for(int i=0;i='a')&&(tmp[i]='A')&&(tmp[i]='0')&&(tmp[i]<='9'))))
{
cout<<"Zły znak w nazwie n-----n"<<komenda;
blad=ERR_NAME_CHAR;
throw(blad);
}
}
}
}
return blad;
}
int Zrob()
{
if(klucze.at(0)=="INSERT")
{
blad=Insert();
}
else if(klucze.at(0)=="CREATE")
{
blad=Create();
}
else if(klucze.at(0)=="FILTER")
{
blad=Filter();
}
else if(klucze.at(0)=="AGREGATE")
{
blad=Agregate();
}
else if(klucze.at(0)=="JOIN")
{
blad=Join();
}
else if(klucze.at(0)=="PRINT")
{
blad=Print();
}
else if(klucze.at(0)=="MERGE")
{
blad=Merge();
}
else if(klucze.at(0)=="LOAD")
{
blad=Load();
}
else
{
cout<<"Nieznana komenda n-----n"<<komenda;
blad=ERR_COMM;
throw(blad);
}
return blad;
}
int Wykonaj(string polecenie)
{
Przetworz(polecenie);
if(blad==0)
{
Zrob();
}
return blad;
}
}; // Koniec klasy Parser.
int main()
{
Parser pars;
string wiersz;
int blad=0;
while((blad==0)&&(getline(cin,wiersz)))
{
pars.Wykonaj(wiersz);
blad=pars.blad;
pars.Czysc();
}
return 0;
}